AI资讯新闻榜单内容搜索-2

RL 将如何提高具身大模型 VLA 泛化性？清华大学团队NeurIPS 2025文章分析 RL 与 SFT 泛化性差异

在具身智能领域，视觉 - 语言 - 动作（VLA）大模型正展现出巨大潜力，但仍面临一个关键挑战：当前主流的有监督微调（SFT）训练方式，往往让模型在遇到新环境或任务时容易出错，难以真正做到类人般的泛化

来自主题: AI技术研报

7605 点击 2025-10-13 10:28

谷歌Gemini 3.0「全家桶」年度压轴，前端不再需要人类！下周王者降临

Gemini 3.0更近了！网友爆料称，谷歌下一代旗舰模型将在10月22日发布。一些拿到内测资格的开发者，放出了最全面的demo，Gemini 3.0能做到一次性直出网页、游戏、原创音乐等。前端开发，再也不需要人类。

来自主题: AI资讯

9175 点击 2025-10-13 10:20

永别了，人类冠军！AI横扫天文奥赛，GPT-5得分远超金牌选手2.7倍

国际奥赛又一块金牌，被AI夺下了！在国际天文与天体物理奥赛（IOAA）中，GPT-5和Gemini 2.5 Pro完胜人类选手，在理论和数据分析测试中，拿下了最高分。在理论考试上，Gemini 2.5 Pro总体得分85.6%，GPT-5总体得分84.2%；

来自主题: AI资讯

8019 点击 2025-10-12 15:04

两周冲到200万美元ARR！这家AI创业公司凭什么拿下1亿美元估值？

这不是科幻，这是 Anything 正在发生的真实故事。这家刚刚完成 1100 万美元融资、估值达到 1 亿美元的创业公司，在上线两周内就实现了 200 万美元的年度经常性收入。更让人震惊的是，他们的用户已经开始用这个平台做出真正赚钱的生意。我深入研究了这家公司后，发现他们不只是又一个 AI 编程工具，而是在彻底改变软件开发的游戏规则。

来自主题: AI资讯

5954 点击 2025-10-12 15:03

国产游戏理解模型刷新SOTA，对话逗逗AI CEO：开源模型+行业数据是突破关键

游戏理解领域模型LynkSoul VLM v1，在游戏场景中表现显著超过了包括GPT-4o、Claude 4 Sonnet、Gemini 2.5 Flash等一众顶尖闭源模型。背后厂商逗逗AI，亦在现场吸引了不少关注的目光。

来自主题: AI资讯

7517 点击 2025-10-11 17:25

开源编程模型王座易主了，谁能想到新SOTA是快手

开源编程模型王座，再度易主！来自快手的KAT-Dev-72B-Exp，在SWE-Bench认证榜单以74.6%的成绩夺得开源模型第一。KAT-Dev-72B-Exp是KAT-Coder模型的实验性强化学习版本。

来自主题: AI资讯

10231 点击 2025-10-11 15:57

信息量爆炸！深度解读 300页 AI 年度百科报告《State of AI 2025》

昨天，State of AI Report 2025 正式发布了。背后主笔是硅谷投资人 Nathan Benaich 和他创办的 Air Street Capital，从 2018 年开始，这份报告就被称为“AI 行业的年度百科”。

来自主题: AI技术研报

5937 点击 2025-10-11 15:57

中国地图上的111家AI制药公司（截至10月）

截至2025年10月，据智药局不完全统计，中国AI制药公司已经达到了111家。其中，94%的企业密集分布于北京、长三角与大湾区，北京、上海、深圳三城集聚效应显著，形成“三足鼎立”之势。毫无疑问，A

来自主题: AI资讯

8637 点击 2025-10-11 12:47

当两个「世界第一」同时出现｜写在混元与可灵先后宣布登顶全球第一之后

最近，两条消息同时刷屏：先是 9 月 23 日快手宣布其可灵 2.5 Turbo 图生/文生视频模型，推出 10 天后，即在 Artificial Analysis 上成为世界第一；紧接着，腾讯也宣布混元图像 3.0 模型在 LMArena 上成为世界第一。

来自主题: AI资讯

8275 点击 2025-10-11 12:11

速递｜AI医疗记录Heidi Health，获6500万美元B轮融资，每周服务超过200万名临床医生

“我们希望打造一个能与临床医生并肩工作的 AI 护理助手，接管行政事务，让我们这样的医疗从业者能专注于毕生追求的诊疗工作，”他向 TechCrunch 表示。凯利医生与曾在初创公司共事的瓦利德·穆萨联手，于 2021 年创立 Heidi Health。该公司于 2024 年初开始推出产品。

来自主题: AI资讯

7386 点击 2025-10-11 12:07