AI资讯新闻榜单内容搜索-大模

2026年，大模型训练的下半场属于「强化学习云」

2024 年底，硅谷和北京的茶水间里都在讨论同一个令人不安的话题：Scaling Law 似乎正在撞墙。

来自主题: AI技术研报

8488 点击 2026-01-12 15:13

过去一年，大模型在语言与文本推理上突飞猛进：论文能写、难题能解、甚至在顶级学术 / 竞赛类题目上屡屡刷新上限。但一个更关键的问题是：当问题不再能 “用语言说清楚” 时，模型还能不能 “看懂”？

来自主题: AI技术研报

9368 点击 2026-01-12 14:07

谷歌 Gemini 数据联合负责人 Andrew Dai 联手苹果首席研究科学家 Yinfei Yang，隐身创办 AI 新秀 Elorian。首轮将融资 5000 万美元，剑指「视觉推理」这个下一代大模型的核心问题。

来自主题: AI资讯

6525 点击 2026-01-12 10:31

大模型能写代码、解奥数，却连幼儿园小班都考不过？简单的连线找垃圾桶、数积木，人类一眼即知，AI却因为无法用语言「描述」视觉信息而集体翻车。大模型到底「懂不懂」，这个评测基准给出答案。

来自主题: AI技术研报

8839 点击 2026-01-12 10:29

这些改变世界的产品，最初居然都是不被当回事儿的支线项目（side project）？！

来自主题: AI资讯

8339 点击 2026-01-12 10:03

刚刚，GPT-5.2刷新了一项新纪录！OpenAI联合创始人Greg Brockman发帖称使用GPT-5.2在ARC-AGI-2基准测试上，表现超过了人类基线水平。

来自主题: AI资讯

9804 点击 2026-01-11 10:10

1月10日，很久没有公开露面的月之暗面创始人杨植麟，在一场定向邀请的行业论坛中，详细地分享了2025年Kimi的技术路线重点，以及对未来的思考。这次分享，有一个核心关键词，Agentic智能时代。这是通用大模型竞争的一个未来高地

来自主题: AI资讯

8443 点击 2026-01-11 09:51

在真实世界中，部署并不是一个孤立步骤，而是一条连续链路：工具能否被发现、是否被正确理解、能否构建环境，以及是否真的可以被执行。Deploy-Master 正是围绕这条链路，被设计为一个以执行为中心的一站式自动化工作流。

来自主题: AI资讯

8256 点击 2026-01-10 17:04

就在医疗AI赛道激战正酣时，一个搅局者低调入场了。它就是蚂蚁集团联合浙江省卫生健康信息中心、浙江省安诊儿医学人工智能科技有限公司开源的医疗大模型——蚂蚁·安诊⼉（AntAngelMed）。

来自主题: AI资讯

8195 点击 2026-01-10 17:03

近年来，大语言模型在算术、逻辑、多模态理解等任务上之所以取得显著进展，很大程度上依赖于思维链（CoT）技术。所谓 CoT，就是让模型在给出最终答案前，先生成一系列类似「解题步骤」的中间推理。这种方式

来自主题: AI技术研报

5620 点击 2026-01-10 17:00