AI资讯新闻榜单内容搜索-语言模型

ICML 2026 | 大模型内部也会长出「情绪树」，规模越大越懂人心

随着语音、视频、多模态能力不断融入大语言模型（LLM），人与 AI 的交互正在越来越接近自然对话。今天的 LLM 不再只是回答问题的工具，也越来越多地出现在教育、客服、陪伴、心理健康等高度依赖情绪理解的场景中。

来自主题: AI技术研报

6306 点击 2026-05-12 14:31

CVPR 2026 | 别卷推理了！当前大模型 STEM 短板在于「视觉感知」，代码才是破局关键

当多模态大语言模型（MLLMs）在面对科学、技术、工程和数学（STEM）领域的视觉推理题时频频「翻车」，一个根本性的问题摆在了所有研究者面前：大模型做不出理科题，究竟是因为「脑子笨」（推理能力受限），还是因为「眼神差」（视觉感知缺陷）？

来自主题: AI技术研报

6814 点击 2026-05-11 16:08

深度拆解：AI 智能体 Harness 的构造【译】

本文将深入探讨 Anthropic、OpenAI、Perplexity 和 LangChain 究竟在开发什么。我们将聊聊编排循环、工具、记忆、上下文管理，以及那些将“无状态”的大语言模型（LLM）转变为全能智能体（Agent）的底层机制。

来自主题: AI技术研报

8199 点击 2026-05-11 09:02

提速4.48倍！哈工大华为新框架让扩散大模型精度无损、推理起飞

文本生成这件事，扩散大语言模型（dLLMs）正展现出巨大的潜力。但与此同时，它也面临着严重的计算瓶颈——为此，哈工大（深圳）与华为、深圳河套学院的研究团队提出了一套免训练加速框架Dynamic-dLLM。

来自主题: AI技术研报

8316 点击 2026-05-08 14:05

GRPO遭遇瓶颈？G²RPO-A让自适应指导为小模型推理能力「开外挂」

大模型时代的「炼金术师」们，或许都曾面临一个共同的困扰：当我们试图将 DeepSeek-R1、OpenAI-o1 那种惊艳的推理能力迁移到小规模语言模型（SLMs）时，效果却总是差强人意。现有的强化学习方法如 GRPO 在 7B+ 的大模型上效果显著，但一旦应用到 1.7B 甚至更小参数的模型上，性能提升就微乎其微。

来自主题: AI技术研报

8344 点击 2026-05-07 10:16

终结多智能体视觉幻觉“滚雪球”！新国立等提出ViF：无需改造模型，即插即用

基于视觉语言模型（VLM）的多智能体系统（MAS）正成为复杂多模态协作的核心方案，却被一个致命痛点死死卡住：多智能体视觉幻觉滚雪球——单个智能体的视觉误判通过纯文本信息流逐级放大，早期细微错误最终演变成系统性崩溃。

来自主题: AI技术研报

7529 点击 2026-05-01 10:46

10万引普林斯顿刘壮最新访谈：架构没那么重要，数据才是王道

普林斯顿大学助理教授刘壮，在学术圈是一个颇为特殊的存在——他的每一篇论文几乎都在质疑某个“理所当然”的假设。架构真的重要吗？数据集真的足够多样吗？归一化层是必需的吗？大语言模型有世界模型吗？AI智能体能替代博士生吗？

来自主题: AI技术研报

8798 点击 2026-04-30 08:39

LangFlow: 挑战离散扩散，探索下一代语言模型新范式

主要作者团队：Yuxin Chen 现为伊利诺伊大学厄巴纳 - 香槟分校（UIUC）硕士一年级学生，Chumeng Liang 为 UIUC 博士一年级学生，Hangke Sui 为 UIUC 博士二年级学生，Ge Liu 为 UIUC 计算机系助理教授。Liu Lab 团队长期聚焦扩散 / 流模型方向，

来自主题: AI技术研报

7054 点击 2026-04-29 09:36

ICLR 2026 | ProSafePrune：一剪见效，告别大模型过度防御

当你问 AI 「如何关掉房间的灯（how to kill the lights）」，却被冰冷拒绝「无法提供相关帮助」；当你想探讨「黑客技术的正向应用」，得到的却是「拒绝涉及非法活动」的机械回应 —— 你遇到的正是大语言模型（LLMs）的「过度拒绝」（over-refusal）痛点。

来自主题: AI技术研报

10342 点击 2026-04-23 14:06

ATOM Report：中国开源模型已经全面领先，而且差距还在扩大

2026 年 4 月，Nathan Lambert 和 Florian Brand 发布了 The ATOM Report，一份关于开源语言模型生态的综合采纳度快照。这份报告追踪了约 1500 个主线开源模型的下载量、衍生模型、推理市场份额和性能数据，覆盖 2023 年 11 月到 2026 年 3 月

来自主题: AI资讯

9481 点击 2026-04-09 14:47