AI资讯新闻榜单内容搜索-Token

150B token从头训练，普林斯顿Meta发布完全可微MoE架构Lory

前几天，普林斯顿大学联合Meta在arXiv上发表了他们最新的研究成果——Lory模型，论文提出构建完全可微的MoE模型，是一种预训练自回归语言模型的新方法。

来自主题: AI技术研报

9518 点击 2024-05-20 16:10

红极一时的思维链技术，可能要被推翻了！

来自主题: AI技术研报

4530 点击 2024-05-14 10:49

关于大模型分词（tokenization），大神Karpathy刚刚推荐了一篇必读新论文。

来自主题: AI技术研报

10217 点击 2024-05-13 17:28

昨天刚刚在顶会ICLR作为特邀演讲（Invited Talk）中“国内唯一”的大模型玩家智谱AI，今天又放出了一个好消息

来自主题: AI技术研报

8137 点击 2024-05-12 12:35

在刚刚举行的 ICLR 2024 大会上，智谱AI的大模型技术团队公布了面向激动人心的AGI通用人工智能前景的三大技术趋势，同时预告了GLM的后续升级版本。

来自主题: AI资讯

5277 点击 2024-05-12 11:19

开源大模型领域，又迎来一位强有力的竞争者。

来自主题: AI技术研报

10247 点击 2024-05-07 18:24

AI做数学题，真正的思考居然是暗中“心算”的？

来自主题: AI技术研报

5871 点击 2024-05-05 19:25

“预测下一个token”被认为是大模型的基本范式，一次预测多个tokens又会怎样？

来自主题: AI技术研报

5165 点击 2024-05-03 22:03

91行代码、1056个token，GPT-4化身黑客搞破坏！

来自主题: AI技术研报

5674 点击 2024-04-21 23:11

如今，大型语言模型（LLM）已经成为了我们生活中的好帮手

来自主题: AI技术研报

4808 点击 2024-04-19 20:56