AI资讯新闻榜单内容搜索-模型

13人干翻Transformer！新架构SSA算力暴减千倍，成本仅Opus 5%

Transformer统治地位悬了！一款SubQ模型带着SAA架构横空出世，1200万上下文成本仅Opus的5%，计算量暴减千倍。

来自主题: AI资讯

9831 点击 2026-05-07 10:59

本地4B开源模型，把任何App当Skill用！告别token焦虑，私密性强～

上次给大家分享了一个 CUA 的开源项目，能让 AI Agent 直接操控电脑界面，相当于把任何 App 都变成 Agent 的 Skill。反响还不错。

来自主题: AI技术研报

7218 点击 2026-05-07 10:18

多轮Agent蒸馏终于不翻车！港中文x通义新方法成功率暴涨18点，训练还快32%

把强大模型的能力“蒸馏”给小模型，听起来很美—— 但放到多轮对话Agent场景里，效果往往一塌糊涂。

来自主题: AI技术研报

8527 点击 2026-05-07 10:17

GRPO遭遇瓶颈？G²RPO-A让自适应指导为小模型推理能力「开外挂」

大模型时代的「炼金术师」们，或许都曾面临一个共同的困扰：当我们试图将 DeepSeek-R1、OpenAI-o1 那种惊艳的推理能力迁移到小规模语言模型（SLMs）时，效果却总是差强人意。现有的强化学习方法如 GRPO 在 7B+ 的大模型上效果显著，但一旦应用到 1.7B 甚至更小参数的模型上，性能提升就微乎其微。

来自主题: AI技术研报

8396 点击 2026-05-07 10:16

蔡浩宇美国公司换血背后：裁撤大模型团队，押注超级智能体

在对多位内部开发者的采访中得知，这个模型的研发已被叫停。LPM 1.0 并非仍在推进的核心项目，而是视频团队对过去一年工作成果的集中汇报——既是对外展示，也是对内总结。该视频团队由“童姥”（前微软亚研院首席研究员童欣）带领， AilingZeng做Tech Lead，作者中近半数来自 Anuttacon内部，蔡浩宇本人并未直接参与模型研发。

来自主题: AI资讯

8922 点击 2026-05-07 01:20