AI资讯新闻榜单内容搜索-训练

xAI再失华人大将：预训练负责人已离职，马斯克又留不住人了

刚刚，xAI再失一名华人大将。就在今天，预训练负责人庄钧堂官宣了自己的离职消息。此前，庄钧堂已经在xAI工作了两年。这期间，他主导了从Grok 2到Grok 5的全系列预训练，同时负责Grok在X和Tesla上的语音模型及xAI企业API模型。

来自主题: AI资讯

9041 点击 2026-05-09 13:17

大模型不认识马嘉祺？我们做了一次全链路排查

MiniMax M2 系列受到了开发者社区的广泛关注，不少用户在深度使用中发现了一些个例问题，其中“模型无法说出马嘉祺”这个问题引发了较多讨论。我们也注意到，社区中有不少开发者对这个现象进行了高质量

来自主题: AI技术研报

9956 点击 2026-05-09 10:35

破案了！为啥ChatGPT老想着「稳稳地接住你」

其中，大家「讨伐」声量最大的莫过于 ChatGPT 了，从 AI 味儿熏人的经典破折号、「不是 A，而是 B」句式，以及前段时间间歇性出现的「哥布林」，再到如今充满青春伤痛文学矫情劲儿的「我会稳稳接住你」，用户快要被折磨疯了：我们关系可以亲密，但没必要这么亲密。

来自主题: AI资讯

8878 点击 2026-05-08 15:31

ACL 2026｜告别冗长思维链！Laser用「概率叠加」重塑多模态大模型隐式推理

为了解决这一痛点，由 MBZUAI、复旦大学、中国人民大学高瓴人工智能学院以及哈佛大学联合组成的研究团队，提出了一种名为 Laser 的全新隐式视觉推理范式。该研究从认知心理学中汲取灵感，引入了 “Forest-before-Trees” 的认知机制，通过动态窗口对齐学习（DWAL），首次实现了在隐空间中维持视觉特征的 “概率叠加” 状态。

来自主题: AI技术研报

7115 点击 2026-05-08 14:07

万帧照片级仿真，打通视觉机器人学习的感知与物理鸿沟：国产仿真器GS-Playground入选RSS 2026

近日，清华大学智能产业研究院（AIR）DISCOVER Lab 联合谋先飞技术、原力灵机、求之科技和地瓜机器人，提出了新一代高通量视觉高保真仿真器 GS-Playground。该成果已被机器人领域国际顶级学术会议 RSS 2026（Robotics: Science and Systems）录用，标志着国内具身智能仿真基础设施在视觉保真度与训练吞吐量两个维度上同时取得了国际领先水平的突破。

来自主题: AI技术研报

8253 点击 2026-05-08 14:06

token级，精准控制生成长度：3B模型击败GPT 5.4、Claude

LenVM将长度建模提升到token级别，开辟可扩展价值预训练的新维度——3B开源模型精确长度控制全面击败GPT-5.4、Claude-Opus-4-6等顶级闭源模型；相同token预算下推理准确率提升10倍（63% vs 6%）；沿模型规模、数据量、采样数三轴无饱和scaling的value pretraining

来自主题: AI技术研报

6467 点击 2026-05-08 14:06

提速4.48倍！哈工大华为新框架让扩散大模型精度无损、推理起飞

文本生成这件事，扩散大语言模型（dLLMs）正展现出巨大的潜力。但与此同时，它也面临着严重的计算瓶颈——为此，哈工大（深圳）与华为、深圳河套学院的研究团队提出了一套免训练加速框架Dynamic-dLLM。

来自主题: AI技术研报

8787 点击 2026-05-08 14:05

DeepMind入股硬核网游EVE，要让AI学「黑暗森林」

本周四，Google DeepMind 宣布他们又要开始打游戏了。这次目标还是全世界最硬核的那一款：EVE Online。Google DeepMind 此次宣布收购著名科幻在线角色扮演游戏《EVE Online》（星战前夜）开发商的部分股权，并表示将利用该游戏研究「复杂、动态、玩家驱动的系统中的智能」。

来自主题: AI资讯

10011 点击 2026-05-08 10:11

只看图片就能学会压缩Token！浙大&阿里新框架多轮VQA压缩率90%，精度不掉｜CVPR 2026

多轮视觉问答，正在成为LVLM推理效率的“照妖镜”。

来自主题: AI技术研报

8869 点击 2026-05-08 09:52

OpenAI公开大规模稳定训练的秘密，英伟达AMD英特尔都受益

OpenAI，这次又真·Open了一下。

来自主题: AI技术研报

8224 点击 2026-05-07 15:31