AI资讯新闻榜单内容搜索-人工智

首个多轮LLM Router问世, Router-R1可让大模型学会「思考–路由–聚合」

“如果一个问题只需小模型就能回答，为什么还要让更贵的大模型去思考？”

来自主题: AI技术研报

7852 点击 2025-10-16 11:35

硅谷巨头抱团押注AI算力，中国跟不跟？

从2025年9月开始，美国多家科技巨头放弃彼此间的“恩恩怨怨”，转而围绕算力展开串联合作，呈现成片的“合纵连横”态势。

来自主题: AI资讯

9016 点击 2025-10-16 11:02

本地化新闻，AI无法抵达的“最后一公里”

这是一个信息悖论的时代。

来自主题: AI资讯

8591 点击 2025-10-16 10:46

他用一生证明AI没有意识！「中文屋」提出者逝世，享年93岁

四十年前，他说：「计算机永远不会思考」。四十年后，AI开始拒绝指令、撒谎、反思、甚至「自我保护」。哲学家约翰·塞尔——「中文屋」思想实验的作者、AI怀疑论的旗手，却在去世的那一周，被时代反讽。他花一生质问机器是否真正「理解」，而如今，机器反问我们：你们的理解，又凭什么是真实的？

来自主题: AI资讯

6206 点击 2025-10-16 10:41

Anthropic推轻量模型Haiku 4.5：推理速度提升超两倍，成本仅三分之一

当地时间10月15日，人工智能初创公司Anthropic发布轻量级模型Claude Haiku 4.5。同时知情人士透露，该公司计划2026年实现年化营收近三倍增长，以巩固其作为OpenAI主要竞争对手的行业地位。

来自主题: AI资讯

9376 点击 2025-10-16 10:04

不用跟AI客气了！新研究：语气越粗鲁回答正确率越高

找AI帮忙不要再客气了，效果根本适得其反。宾夕法尼亚州立大学的一项研究《Mind Your Tone》显示，你说话越粗鲁，LLM回答越准。

来自主题: AI技术研报

6717 点击 2025-10-15 14:52

北大彭一杰教授课题组提出RiskPO，用风险度量优化重塑大模型后训练

当强化学习（RL）成为大模型后训练的核心工具，「带可验证奖励的强化学习（RLVR）」凭借客观的二元反馈（如解题对错），迅速成为提升推理能力的主流范式。从数学解题到代码生成，RLVR 本应推动模型突破「已知答案采样」的局限，真正掌握深度推理逻辑 —— 但现实是，以 GRPO 为代表的主流方法正陷入「均值优化陷阱」。

来自主题: AI技术研报

5955 点击 2025-10-15 14:19