AI资讯新闻榜单内容搜索-scaling

OneReason：当推荐系统学会思考

推荐系统的过去十年，本质是把 "用户 - 物料" 的统计共现挖到极致 —— 从协同过滤、深度模型，到生成式 OneRec 系列，每一代都在让 "记忆" 更精细、参数更大、序列更长，也让 Scaling 这件事在工业级推荐系统上跑通，持续释放算力红利。

来自主题: AI技术研报

8317 点击 2026-06-10 14:43

当线性注意力学会「写入前思考」：并行化的多步记忆写入

Transformer 依托强大的建模能力和 Scaling 效率在推荐领域被广泛应用于超长序列建模和生成式推荐等方向，

来自主题: AI技术研报

7018 点击 2026-06-10 14:43

多变量神经缩放定律迈向大一统：Mila联手DeepMind提出UNSL

过去的大模型 scaling law 通常回答的是：当模型参数量、数据量和训练计算量增加后，loss 会如何下降。

来自主题: AI技术研报

6954 点击 2026-05-29 09:19

极佳视界发布物理AGI「双金字塔」体系：数据与算法如何撑起具身智能Scaling Law？

5 月 20 日，武汉光谷。极佳视界（GigaAI）在「家庭场景子品牌发布会暨物理通用智能技术发布会」上，给出了一份相对完整的答案。这场发布会公布了五件事：全球首个物理 AGI「双金字塔」体系；家庭场景子品牌「拾光 SeeLight」与首款家庭通用人形机器人「拾光 S1」同步亮相；国内首个真实家庭场景百台部署落地武汉，Q3 起规模化运营；

来自主题: AI资讯

9737 点击 2026-05-23 10:02

独家｜ChatGPT核心贡献者姜旭归国创业：把LLM的Scaling带到具身智能

姜旭是少数完整参与过 OpenAI 大模型核心技术演进的华人创业者之一。2019 至 2023 年间，他经历了 GPT 系列能力爆发最关键的阶段，工作横跨底层训练 infra、大规模预训练、RLHF 对齐算法与数据构建等核心链路。

来自主题: AI资讯

10960 点击 2026-05-22 10:26

ICML 2026｜拒绝大力出奇迹，PRISM框架让dLLM也能高效Test-Time Scaling

近年来，大模型能力提升的焦点正在从「训练时扩展」转向「推理时扩展」。从 Best-of-N、Self-Consistency 到更复杂的搜索与验证框架，Test-Time Scaling 已经成为提升大模型复杂推理能力的重要范式。

来自主题: AI技术研报

6498 点击 2026-05-11 16:09

token级，精准控制生成长度：3B模型击败GPT 5.4、Claude

LenVM将长度建模提升到token级别，开辟可扩展价值预训练的新维度——3B开源模型精确长度控制全面击败GPT-5.4、Claude-Opus-4-6等顶级闭源模型；相同token预算下推理准确率提升10倍（63% vs 6%）；沿模型规模、数据量、采样数三轴无饱和scaling的value pretraining

来自主题: AI技术研报

6195 点击 2026-05-08 14:06