AI资讯新闻榜单内容搜索-模型

⽆需任何监督信号！自博弈机制让深度搜索Agent实现自我进化

来⾃阿⾥巴巴夸克、北京⼤学、中⼭⼤学的研究者提出了⼀种新的解决⽅案：搜索自博弈 Search Self-play（SSP）⸺⼀种⾯向深度搜索 Agent 的⾃我博弈训练范式。其核⼼思路是：让⼀个模型同时扮演两个⻆⾊⸺「出题者」和「解题者」，它们在对抗训练中共同进化，使训练难度随着模型能⼒动态提升，最终形成⼀个⽆需⼈⼯标注的动态博弈⾃我进化过程。

来自主题: AI技术研报

6387 点击 2025-11-16 10:36

OpenAI新论文拆解语言模型内部机制：用「稀疏电路」解释模型行为

就在今天，OpenAI 发布了一项新研究，使用新方法来训练内部机制更易于解释的小型稀疏模型，其神经元之间的连接更少、更简单，从而观察它们的计算过程是否更容易被人理解。

来自主题: AI技术研报

7511 点击 2025-11-15 17:47

Jeff Dean盛赞姚班校友AI新研究，目前人已到Meta

谷歌AI掌舵人Jeff Dean点赞了一项新研究，还是出自清华姚班校友钟沛林团队之手。Nested Learning嵌套学习，给出了大语言模型灾难性遗忘这一问题的最新答案！简单来说，Nested Learning（下称NL）就是让模型从扁平的计算网，变成像人脑一样有层次、能自我调整的学习系统。

来自主题: AI资讯

8231 点击 2025-11-15 17:45

专为端侧大模型而生：解密AI计算加速“秘密武器”Arm China周易X3 NPU IP

从手机、PC、汽车到机器人，我们需要怎样的端侧AI "芯" 思路？作者 | 云鹏编辑 | 漠影机器人走猫步引爆行业、舞蹈功夫如人类般丝滑；AI手机一句话订外卖做报告、懂你所想知你所言；AI PC

来自主题: AI资讯

7332 点击 2025-11-15 17:35

李飞飞和LeCun的世界模型之争

AGI之路，终于交汇到了世界模型的战场。李飞飞，发布了旗下首款商用世界模型Marble；几乎同一时间，Lecun离职Meta，准备创立自己的世界模型公司；在此之前，谷歌旗下的世界模型Genie 3，也曾掀起业界轰动。

来自主题: AI资讯

8315 点击 2025-11-15 17:25

Transformer作者重磅预言：AI无寒冬，推理革命引爆万亿市场！

Transformer的火种已燃烧七年。如今，推理模型（Reasoning Models）正点燃第二轮革命。Transformer共同作者、OpenAI研究员Łukasz Kaiser预判：未来一两年，AI会极速跃升——瓶颈不在算法，而在GPU与能源。

来自主题: AI资讯

8095 点击 2025-11-15 17:00

小米给智能家居做了个“大模型大脑”

智能家居不够“智能”，怎么办？小米集团给出了智能家居未来探索方案Xiaomi Miloco。该方案基于大模型独特的开发范式，用户可以跟智能家居系统对话沟通，经过大模型的推理计算，自动完成家庭生活中的各类智能需求和规则。

来自主题: AI资讯

8644 点击 2025-11-15 11:48

阿里云，用全栈 AI 刷新第十七个双十一

今年也是阿里从芯片到云到 PaaS 到大模型，再到顶层 agent 等全栈 AI 能力接入的首个双 11——世界范围内，从未有过如此大规模生产场景 AI 落地。场景变化，用户量增加，叠加全栈 AI 接入——当双 11 技术备战进入第 17 个年头，其意义早已超越一次促销的技术保障。

来自主题: AI资讯

8252 点击 2025-11-15 11:44

全球最大开源具身大模型！中国机器人跑完马拉松后开始学思考

昨天，全球参数量最大的具身智能多模态大模型——Pelican-VL 1.0正式开源。它不仅覆盖了7B到72B级别，能够同时理解图像、视频和语言指令，并将这些感知信息转化为可执行的物理操作。

来自主题: AI资讯

8542 点击 2025-11-15 10:18

GPT-4o准确率仅为24%！权威中文教育基准：知识+情商的双重考验

华东师范大学智能教育学院发布OmniEduBench，首次从「知识+育人」双维度评测大模型教育能力。测评2.4万道中文题后，实验结果显示：GPT-4o等顶尖AI会做题，却在启发思维、情感支持等育人能力上远不及人类，暴露AI当老师的关键短板。

来自主题: AI技术研报

7243 点击 2025-11-15 10:15