AI资讯新闻榜单内容搜索-模型训练

OneSearch，揭开快手电商搜索「一步到位」的秘技

还有一个多月，一年一度的“双十一”购物节就要来了！作为消费者，你通常会如何寻找心仪的商品呢？或许你兴致勃勃地在搜索框里敲下关键词，却发现呈现出来的商品列表总是差强人意。那么，问题究竟出在哪里？

来自主题: AI技术研报

9988 点击 2025-09-18 15:27

AI在实时视频里秒“剪”出你想要的部分！输入文字/图/视频片段，它都能秒懂｜ICCV2025

还在实时视频里找特定事件找半天？最新技术直接开挂了。

来自主题: AI技术研报

8224 点击 2025-09-18 15:23

腾讯AI Lab首创RL框架Parallel-R1，教大模型学会「并行思维」

自从 Google Gemini 将数学奥赛的成功部分归功于「并行思维」后，如何让大模型掌握这种并行探索多种推理路径的能力，成为了学界关注的焦点。

来自主题: AI技术研报

9330 点击 2025-09-18 15:04

高阶程序，让AI从技术可行到商业可信的最后一公里

很多人相信，我们已经进入了所谓的「AI 下半场」，一个模型能力足够强大、应用理应爆发的时代。然而，对于这个时代真正缺少的东西，不同的人有不同的侧重，比如（前）OpenAI 研究者姚顺雨强调了评估的重要性，著名数学家陶哲轩则指出必须降低成本才能实现规模化应用。

来自主题: AI技术研报

7601 点击 2025-09-18 14:55

突破单链思考上限，清华团队提出原生「并行思考」scale范式

近年来，大语言模型（LLMs）在复杂推理任务上的能力突飞猛进，这在很大程度上得益于深度思考的策略，即通过增加测试时（test-time）的计算量，让模型生成更长的思维链（Chain-of-Thought）。

来自主题: AI技术研报

8254 点击 2025-09-18 14:49

微软警告：大模型ICL并非真正意义上的学习，你的AI Agent随时可能“失忆”

上下文学习”（In-Context Learning，ICL），是大模型不需要微调（fine-tuning），仅通过分析在提示词中给出的几个范例，就能解决当前任务的能力。您可能已经对这个场景再熟悉不过了：您在提示词里扔进去几个例子，然后，哇！大模型似乎瞬间就学会了一项新技能，表现得像个天才。

来自主题: AI技术研报

7742 点击 2025-09-18 14:44

来自MIT的最新研究-RL's Razor｜展望LLMs Post-Training下的前沿探索与思考

来自MIT Improbable AI Lab的研究者们最近发表了一篇题为《RL's Razor: Why Online Reinforcement Learning Forgets Less》的论文，系统性地回答了这个问题，他们不仅通过大量实验证实了这一现象，更进一步提出了一个简洁而深刻的解释，并将其命名为 “RL's Razor”（RL的剃刀）。

来自主题: AI技术研报

8241 点击 2025-09-18 14:26

刚刚，DeepSeek登上Nature封面！梁文锋带队回应质疑，R1训练真29.4万美金

DeepSeek荣登Nature封面，实至名归！今年1月，梁文锋带队R1新作，开创了AI推理新范式——纯粹RL就能激发LLM无限推理能力。Nature还特发一篇评论文章，对其大加赞赏。

来自主题: AI资讯

10209 点击 2025-09-18 13:49

具身智能能力狂飙，安全却严重滞后？首个安全可信EAI框架与路线图出炉！

近年来，以人形机器人、自动驾驶为代表的具身人工智能（Embodied Artificial Intelligence, EAI）正以前所未有的速度发展，从数字世界大步迈向物理现实。然而，当一次错误的风险不再是屏幕上的一行乱码，而是可能导致真实世界中的物理伤害时，一个紧迫的问题摆在了我们面前：如何确保这些日益强大的具身智能体是安全且值得信赖的？

来自主题: AI技术研报

8377 点击 2025-09-17 14:33

谷歌DeepMind「粪坑淘金」全新方法，暗网毒数据也能训出善良模型

谷歌DeepMind研究团队一年前的研究成果直到昨晚才姗姗揭秘，提出了一种叫做GDR的新方法，颠覆了传统训练中设法剔除脏数据的思路，将饱含恶意内容的数据「变废为宝」，处理后的数据集用于训练，甚至比直接剔除脏数据训练出的模型效果还好，「出淤泥而不染」，「择善而从」。

来自主题: AI技术研报

9768 点击 2025-09-17 09:43