AI资讯新闻榜单内容搜索-预训练

「Next-Token」范式改变！刚刚，强化学习预训练来了

谁说强化学习只能是蛋糕上的樱桃，说不定，它也可以是整个蛋糕呢？

来自主题: AI技术研报

5888 点击 2025-06-11 14:58

为提升大模型“推理+搜索”能力，阿里通义实验室出手了。

来自主题: AI技术研报

8365 点击 2025-05-31 16:19

全球网友用闲置显卡组团训练大模型。40B大模型、20万亿token，创下了互联网上最大规模的预训练新纪录！去中心化AI的反攻，正式开始。OpenAI等巨头的算力霸权，这次真要凉了？

来自主题: AI资讯

5792 点击 2025-05-26 14:42

何恺明团队又一力作！这次他们带来的是「生成模型界的降维打击」——MeanFlow：无需预训练、无需蒸馏、不搞课程学习，仅一步函数评估（1-NFE），就能碾压以往的扩散与流模型！

来自主题: AI技术研报

5999 点击 2025-05-21 14:50

如今，C端产品已经淡出零一万物的业务版图，To B成为核心。

来自主题: AI资讯

6788 点击 2025-05-19 16:51

我们发现，当模型在测试阶段花更多时间思考时，其推理表现会显著提升，这打破了业界普遍依赖预训练算力的传统认知。

来自主题: AI资讯

8876 点击 2025-05-18 14:56

和人工标记数据说拜拜，利用预训练语言模型中的注意力机制就能选择可激发推理能力的训练数据！

来自主题: AI技术研报

6948 点击 2025-05-16 10:07

vivo自研大模型用的数据筛选方法，公开了。

来自主题: AI技术研报

10001 点击 2025-05-15 14:11

不用引入外部数据，通过自我博弈（Self-play）就能让预训练大模型学会推理？

来自主题: AI技术研报

6749 点击 2025-05-12 15:18

当前大模型研究正逐步从依赖扩展定律（Scaling Law）的预训练，转向聚焦推理能力的后训练。鉴于符号逻辑推理的有效性与普遍性，提升大模型的逻辑推理能力成为解决幻觉问题的关键途径。

来自主题: AI技术研报

7777 点击 2025-05-08 10:50