AI资讯新闻榜单内容搜索-LLM

GPT-4o不会数r，被外国小哥原地逼疯！谷歌论文揭秘Transformer「数不到n」

提示工程师Riley Goodside小哥，依然在用「Strawberry里有几个r」折磨大模型们，GPT-4o在无限次PUA后，已经被原地逼疯！相比之下，Claude坚决拒绝PUA，是个大聪明。而谷歌最近的论文也揭示了本质原因：LLM没有足够空间，来存储计数向量。

来自主题: AI技术研报

5483 点击 2024-09-07 17:07

PyTorch官宣：告别CUDA，GPU推理迎来Triton加速新时代

用英伟达的GPU，但可以不用CUDA？PyTorch官宣，借助OpenAI开发的Triton语言编写内核来加速LLM推理，可以实现和CUDA类似甚至更佳的性能。

来自主题: AI技术研报

4469 点击 2024-09-07 11:26

让大模型能听会说，国内机构开源全球首个端到端语音对话模型Mini-Omni

本文出自启元世界多模态算法组，共同一作是来自清华大学的一年级硕士生谢之非与启元世界多模态负责人吴昌桥，研究兴趣为多模态大模型、LLM Agents 等。本论文上线几天内在 github 上斩获 1000+ 星标。

来自主题: AI技术研报

7758 点击 2024-09-07 11:04

LLM 进化分岔口：多模态、成本、代码推理

头部模型的新一代模型的是市场观测、理解 LLM 走向的风向标。即将发布的 OpenAI GPT-Next 和 Anthropic Claude 3.5 Opus 无疑是 AGI 下半场最关键的事件。

来自主题: AI资讯

7487 点击 2024-09-06 11:44

从目前国内LLM模型公司八卦谈起

我个人不是喜欢打听这些公司八卦的人，前些年移动互联网时代就已经有太多这样的小道消息，但最终都没有没什么用。重要的信息迟早会变成公开，最多晚几个月而已，又不是要考虑抢时间窗口投这些公司，花时间去探究ROI不高。

来自主题: AI资讯

6491 点击 2024-09-05 22:15

Unstructured.io：让企业非结构化数据 LLM-Ready

企业要用好 LLM 离不开高质量数据。和传统机器学习模型相比，LLM 对于数据需求量更大、要求更高，尤其是非结构化数据。而传统 ETL 工具并不擅长非结构化数据的处理，因此，企业在部署 LLM 的过程中，数据科学家们往往要耗费大量的时间精力在数据处理环节。这一环节既关系到 LLM 部署的效率和质量，也对数据科学家人力的 ROI 产生影响。

来自主题: AI资讯

9372 点击 2024-09-05 10:02

覆盖 7 百万问答数据，上海 AI Lab 发布 ChemLLM，专业能力比肩 GPT-4

内含一键部署教程

来自主题: AI技术研报

7416 点击 2024-09-04 17:42

清华EconAgent获ACL 2024杰出论文：大模型智能体革新计算经济学研究范式

近日，清华大学电子系城市科学与计算研究中心的研究论文《EconAgent: Large Language Model-Empowered Agents for Simulating Macroeconomic Activities》获得自然语言处理顶会 ACL 2024杰出论文奖（Outstanding Paper Award）。

来自主题: AI技术研报

7599 点击 2024-09-04 15:53

最强笔记软件Obsidian中也能使用LLM，让它成为你的智慧第二大脑

知识管理软件，也上大模型了。

来自主题: AI资讯

7817 点击 2024-09-03 14:58

用最直观的动画，讲解LLM如何存储事实，3Blue1Brown的这个视频又火了

向大模型输入「Michael Jordan plays the sport of _____（迈克尔・乔丹从事的体育运动是……）」，然后让其预测接下来的文本，那么大模型多半能正确预测接下来是「basketball（篮球）」。

来自主题: AI技术研报

6910 点击 2024-09-02 14:48

AI资讯新闻榜单内容搜索-LLM

GPT-4o不会数r，被外国小哥原地逼疯！ 谷歌论文揭秘Transformer「数不到n」

PyTorch官宣：告别CUDA，GPU推理迎来Triton加速新时代

让大模型能听会说，国内机构开源全球首个端到端语音对话模型Mini-Omni

LLM 进化分岔口：多模态、成本、代码推理

从目前国内LLM模型公司八卦谈起

Unstructured.io：让企业非结构化数据 LLM-Ready

覆盖 7 百万问答数据，上海 AI Lab 发布 ChemLLM，专业能力比肩 GPT-4

清华EconAgent获ACL 2024杰出论文：大模型智能体革新计算经济学研究范式

最强笔记软件Obsidian中也能使用LLM，让它成为你的智慧第二大脑

用最直观的动画，讲解LLM如何存储事实，3Blue1Brown的这个视频又火了

GPT-4o不会数r，被外国小哥原地逼疯！谷歌论文揭秘Transformer「数不到n」