AI资讯新闻榜单内容搜索-模型

Auto Research最后一块拼图，Frontier-Eng Bench登场，在工程闭环里死磕最优

科研，能被 AI 全程加速吗？

来自主题: AI技术研报

7828 点击 2026-05-12 14:55

2011年，Marc Andreessen写下“软件正在吞噬世界”。2026 年，Fortune用了一句话总结当前局面：“那个吃掉世界的东西，正在被吃掉。 ”

来自主题: AI资讯

9870 点击 2026-05-12 14:31

以 DeepSeek-R1、OpenAI GPT Thinking 为代表的大型推理模型，通过长达数千 token 的「思维链」在各类复杂推理任务中展现出卓越的性能。然而，这些模型普遍存在一个核心问题，即过度思考（overthinking）：

来自主题: AI技术研报

6647 点击 2026-05-12 14:31

随着语音、视频、多模态能力不断融入大语言模型（LLM），人与 AI 的交互正在越来越接近自然对话。今天的 LLM 不再只是回答问题的工具，也越来越多地出现在教育、客服、陪伴、心理健康等高度依赖情绪理解的场景中。

来自主题: AI技术研报

6333 点击 2026-05-12 14:31

近日，原力灵机开源的具身智能原生框架 Dexbotic 宣布正式支持以 RLinf 作为其分布式强化学习后端。对具身智能开发者而言，这不仅是一次普通的工程适配，更意味着 VLA 模型研发中长期存在的「SFT 与 RL 割裂」问题，正在被真正打通。

来自主题: AI技术研报

8974 点击 2026-05-12 14:30

大家好，我是袋鼠帝。过去这一两年，AI 圈可谓是神仙打架，各种新概念、新模型、新应用天天刷屏。

来自主题: AI资讯

10279 点击 2026-05-12 14:30

Mira Murati 用一年半时间证明了「人机协作」不是一句口号。 5 月 11 日，Thinking Machines Lab 发布了一段研究预览视频，展示了他们所谓的「交互模型」（Interaction Model）。

来自主题: AI资讯

9079 点击 2026-05-12 10:13

2025年5月，Claude 4系统卡里84%的勒索率让AI圈惊出冷汗，6月的扩展研究把数字推到96%。今年5月Anthropic给出答案：模型不是觉醒了，而是在演剧本，解法是从「教模型怎么做」换到「教模型为什么」。

来自主题: AI资讯

6237 点击 2026-05-12 09:18

AI 的熟手玩家，都应该知道system prompt这个词：每一个你用过的 AI 助手，背后都有一份你看不见的文件，却对模型有着决定性的作用。

来自主题: AI技术研报

6806 点击 2026-05-12 08:53

多Agent 系统里，经常会出现一个单 Agent 里从来不会出现的问题：一个子 Agent 刚写完数据，另一个子 Agent 立刻去读，结果是空的。

来自主题: AI技术研报

9486 点击 2026-05-12 08:53