AI资讯新闻榜单内容搜索-Token

思维链不存在了？纽约大学最新研究：推理步骤可「省略」

红极一时的思维链技术，可能要被推翻了！

来自主题: AI技术研报

5281 点击 2024-05-14 10:49

关于大模型分词（tokenization），大神Karpathy刚刚推荐了一篇必读新论文。

来自主题: AI技术研报

11457 点击 2024-05-13 17:28

昨天刚刚在顶会ICLR作为特邀演讲（Invited Talk）中“国内唯一”的大模型玩家智谱AI，今天又放出了一个好消息

来自主题: AI技术研报

9267 点击 2024-05-12 12:35

在刚刚举行的 ICLR 2024 大会上，智谱AI的大模型技术团队公布了面向激动人心的AGI通用人工智能前景的三大技术趋势，同时预告了GLM的后续升级版本。

来自主题: AI资讯

6404 点击 2024-05-12 11:19

传统上，大型语言模型（LLMs）被认为是顺序解码器，逐个解码每个token。

来自主题: AI技术研报

5028 点击 2024-05-10 23:29

开源大模型领域，又迎来一位强有力的竞争者。

来自主题: AI技术研报

11520 点击 2024-05-07 18:24

Meta最近开源的Llama 3模型再次证明了「数据」是提升性能的关键，但现状是，开源的大模型有一堆，可开源的大规模数据却没多少，而收集、清洗数据又是一项极其费时费力的工作，也导致了大模型预训练技术仍然掌握在少数高端机构的手中。

来自主题: AI技术研报

6151 点击 2024-05-05 19:51

AI做数学题，真正的思考居然是暗中“心算”的？

来自主题: AI技术研报

6796 点击 2024-05-05 19:25

“预测下一个token”被认为是大模型的基本范式，一次预测多个tokens又会怎样？

来自主题: AI技术研报

5996 点击 2024-05-03 22:03

2024 年 4 月 20 日，即 Meta 开源 Llama 3 的隔天，初创公司 Groq 宣布其 LPU 推理引擎已部署 Llama 3 的 8B 和 70B 版本，每秒可输出token输提升至800。

来自主题: AI技术研报

6193 点击 2024-05-02 18:03