AI资讯新闻榜单内容搜索-模型

RL特训出「押题大师」？破解模型微调中的多样性危机与灾难性遗忘

RL之后，大模型为什么更容易「越训越单一」？面对五花八门的改进思路，也许答案并不复杂：先试着改一改KL项。

来自主题: AI技术研报

5973 点击 2026-04-09 14:45

MiniMax 发布 MMX-CLI：为 Agent 设计的全模态命令行工具

今天我们发布 MMX-CLI，一个面向 AI Agent 的命令行工具。接入 MMX-CLI 后，Agent 可以在 Claude Code、OpenClaw 等环境中原生调用 MiniMax 最新的编程、视频生成、语音合成、音乐创作等全模态模型，无需适配繁琐接口，也无需额外编写 MCP Server。

来自主题: AI资讯

8987 点击 2026-04-09 13:06

Generalist最新长文定调：具身原生才是正道，中国玩家原力灵机已交卷

Generalist AI的GEN-1热度，仍在发酵。

来自主题: AI资讯

6257 点击 2026-04-09 10:47

黄仁勋刚讲完AI「五层蛋糕」，他们就跑通了！算力、模型、Agent一次打穿

黄仁勋用「五层蛋糕」讲清了AI全栈生态的分层逻辑，易鑫则把它翻译成汽车金融的落地打法：从算力、模型到Agent落地，解决的全是汽车金融最难的活。

来自主题: AI资讯

7434 点击 2026-04-09 10:17

字节 Seed 大模型人才外溢

被动成为新一代 AI 黄埔军校的字节跳动。

来自主题: AI资讯

9651 点击 2026-04-09 09:47

Mac用户可以在oMLX中使用TurboQuant了，搭配Gemma-4-31B，谷歌全家桶实测很能打！

对本地部署玩家，尤其是Mac用户来说，长上下文推理最大的痛点往往不是“模型不够聪明”，而是稍微多用点上下文，统一内存就被撑爆了”，这一点在最近的Gemma-4 31B的部署中尤为明显，在同等上下文的情况，显存占用比Qwen3.5-27B高约一倍不止，直接劝退了不少人。但好消息是，谷歌近期提出的TurboQuant KV缓存量化算法，正是为了解决这个痛点而生。

来自主题: AI技术研报

8516 点击 2026-04-09 09:47

让机器人学会手往哪儿伸、怎么操作，东大团队给了新解法

在具身智能领域，可供性（affordance）预测 —— 即让机器人从视觉观测中理解 "在哪里操作"（接触点）与 "如何操作"（动作方向）—— 是实现精细化机器人操作的基础之一。精细操作要求机器人不仅能定位到物体的可交互区域，更要掌握接触后的准确运动方向，例如判断抽屉把手的精确拉动方向完成开合。

来自主题: AI技术研报

9085 点击 2026-04-09 09:47

生成式推理再排序，可能会是LLM4RecSys的新突破口吗？

大模型（LLM）的世界知识和推理能力是实现下一代推荐系统，即基于大模型的推荐系统（LLM4Recsys）的重要基石。来自meta ai的研究者们尝试将推理模型引入再排序阶段，推荐系统的最后一环。

来自主题: AI技术研报

10455 点击 2026-04-09 09:46

突然袭击！刚刚，Meta超级智能团队首个大模型 Muse Spark 来了

刚刚，Meta 重金组建的超级智能实验室（SML）交卷！这也是年轻华人 Alexandr Wang 带领该团队后，交出的首份成绩。全新自研模型 Muse Spark 上线。

来自主题: AI资讯

8673 点击 2026-04-09 09:26

最强大脑组合！全球SOTA的逻辑和记忆CodeBrain-1&MemBrain1.5同时开源

刚刚，世界模型初创公司 Feeling AI 正式发布并开源 MemBrain1.5 和 CodeBrain-1。这两项在全球 Agentic 领域的顶尖工作同时开源，将正式终结 AI “无状态” 的工具时代，为世界模型植入具备自主逻辑与层级化记忆的 “原生大脑”，开启人机深度协同的交互新范式。

来自主题: AI资讯

8207 点击 2026-04-08 17:32