AI资讯新闻榜单内容搜索-AR

陈丹琦新作：大模型强化学习的第三条路，8B小模型超越GPT-4o

结合RLHF+RLVR，8B小模型就能超越GPT-4o、媲美Claude-3.7-Sonnet。陈丹琦新作来了。他们提出了一个结合RLHF和RLVR优点的方法，RLMT（Reinforcement Learning with Model-rewarded Thinking，基于模型奖励思维的强化学习）。

来自主题: AI技术研报

10552 点击 2025-09-28 23:03

翁荔陈丹琦加盟的840亿AI公司，公开第二篇论文

明星创业公司Thinking Machines，第二篇研究论文热乎出炉！公司创始人、OpenAI前CTO Mira Murati依旧亲自站台，翁荔等一众大佬也纷纷转发支持：论文主题为“Modular Manifolds”，通过让整个网络的不同层/模块在统一框架下进行约束和优化，来提升训练的稳定性和效率。

来自主题: AI技术研报

10619 点击 2025-09-28 09:54

OpenAI两位首席最新采访信息量好大！终极目标是“自动化研究员”，招人并非寻找“最出圈”的人

采访时间不到1小时，信息密度却堪称爆炸！ OpenAI首席科学家Jakub Pachocki和首席研究官Mark Chen开启同台爆料模式：氛围编码的下一步或许是氛围研究（Vibe Researching）；

来自主题: AI资讯

9455 点击 2025-09-28 09:52

6个月内连融两轮5300万美元，这家AI税务公司让Benchmark和YC都抢着投

最近，一家叫 Numeral 的公司刚刚完成了 3500 万美元的 B 轮融资，由 Mayfield 领投，Benchmark、Uncork Capital、Y Combinator 和 Mantis 参与。这轮融资距离他们今年 3 月完成的 1800 万美元 A 轮仅仅过去了 6 个月，公司估值已经达到 3.5 亿美元。

来自主题: AI资讯

10180 点击 2025-09-28 09:52

微软公开预览可充当 MCP 服务器的 Logic Apps

最近，微软宣布了一项新功能的公开预览。该功能使 Azure Logic Apps（标准版）能够充当 MCP 服务器，为开发者提供了一种灵活的方式来构建和管理代理。在 Azure Logic Apps 中，用户可以重新配置 Standard Logic App 使其充当远程模型上下文协议（MCP）服务器，快速启动这些工具的构建工作。

来自主题: AI资讯

9552 点击 2025-09-28 09:50