AI资讯新闻榜单内容搜索-大语言模型

ICLR 2026 | ProSafePrune：一剪见效，告别大模型过度防御

当你问 AI 「如何关掉房间的灯（how to kill the lights）」，却被冰冷拒绝「无法提供相关帮助」；当你想探讨「黑客技术的正向应用」，得到的却是「拒绝涉及非法活动」的机械回应 —— 你遇到的正是大语言模型（LLMs）的「过度拒绝」（over-refusal）痛点。

来自主题: AI技术研报

10701 点击 2026-04-23 14:06

比全球最强推理引擎还快2倍，斯坦福、普林斯顿破解大模型「串行魔咒」

在大语言模型推理领域，虽然「推测解码」（Speculative Decoding，SD）已成为加速生成的标准配置，但它依然存在一个致命弱点： drafting（草拟）和 verification（验证）之间必须串行进行。

来自主题: AI技术研报

8252 点击 2026-04-01 16:20

大部分人都没有的习惯，斯坦福最新报告证实：点踩对AI来说其实很重要！

您在使用LLM时，如果遇到它胡说八道或者彻底偏题，第一反应是什么？大概率是直接关掉窗口，新开一个对话，懒得跟机器废话。但您可能不知道，这个看似再正常不过的习惯，正在给下一代大语言模型的训练库疯狂“投毒”。

来自主题: AI技术研报

9166 点击 2026-03-31 10:03

AI超懂人情世故，但人类就吃这一套：AI谄媚研究登上《科学》杂志

自从大语言模型诞生起至今，AI 已经润物无声地融入了我们的工作生活，也成为了现代社会的重要组成部分。

来自主题: AI技术研报

6937 点击 2026-03-30 16:06

东方理工团队提出HiDrop：重构MLLM计算路径，压缩90%视觉Token实现2.2倍加速

随着多模态大语言模型（MLLM）支持更长上下文，高分辨率图像和长视频会产生远多于文本的视觉 Token，在自注意力二次复杂度下迅速成为效率瓶颈。

来自主题: AI技术研报

9654 点击 2026-03-24 10:13

以「图」破局，HyperOffload定义超节点存储管理新范式

随着生成式 AI 迈入万亿参数时代，大语言模型（LLM）的推理与部署面临着前所未有的“显存墙”挑战。如何在超节点（SuperNode）复杂的异构存储架构下，实现海量张量的高效管理和调度，已成为大模型落地的胜负手。

来自主题: AI技术研报

10560 点击 2026-03-18 09:30

4B模型幻觉抑制能力超越GPT-5，CMU等提出行为校准强化学习新方法

大语言模型（LLM）的幻觉问题一直是阻碍其在关键领域部署的核心难题。近日，研究人员提出了一种名为行为校准强化学习（Behaviorally Calibrated Reinforcement Learning）的新方法，通过重新设计奖励函数，让模型学会「知之为知之，不知为不知」。

来自主题: AI技术研报

8888 点击 2026-03-13 10:10

UIUC清华微软联合提出PlugMem：当Agent记忆告别「经历」，开始存储「经验」

随着大语言模型 Agent 开始在对话、问答与复杂交互环境中长期运行，“记忆该如何设计” 正在成为一个绕不开的核心问题。

来自主题: AI技术研报

10551 点击 2026-03-12 09:53

物理AI的「原生」时刻：原力灵机发布具身大模型DM0

当前，大语言模型（LLMs）和视觉语言模型（VLMs）在语义领域的成功未能直接迁移至物理机器人，归根结底在于其互联网原生的基因。

来自主题: AI技术研报

7126 点击 2026-03-11 15:04

Anthropic工程师都离不开！深夜随手撸出的开源神器，被OpenAl高价收购，23人创业逆袭

昨日，OpenAI 宣布收购了 Promptfoo 以保障其 AI 智能体的安全。这家成立于 2024 年的 AI 安全初创公司，专注于保护大语言模型免受网络攻击。OpenAI 在一篇博客文章中表示，交易完成后，Promptfoo 的技术将整合进 OpenAI Frontier，该平台是其近期推出的、供企业构建和管理 AI 智能体的平台。

来自主题: AI资讯

11087 点击 2026-03-10 15:09