AI资讯新闻榜单内容搜索-幻觉

Contextual AI：从幻觉到可信，钻研RAG架构解决企业级AI应用落地最大痛点

RAG（检索增强生成）作为解决大模型"幻觉"和知识时效性问题的关键技术，已成为企业AI应用的主流架构。Contextual AI由RAG技术的创始研究者组建，致力于开发能应对复杂知识密集型任务的专业智能体。

来自主题: AI资讯

7450 点击 2025-07-17 16:09

面对无解问题大模型竟会崩溃？港中文&华为联合提出首个大模型推理可靠性评估基准

今年初以 DeepSeek-r1 为代表的大模型在推理任务上展现强大的性能，引起广泛的热度。然而在面对一些无法回答或本身无解的问题时，这些模型竟试图去虚构不存在的信息去推理解答，生成了大量的事实错误、无意义思考过程和虚构答案，也被称为模型「幻觉」问题，如下图（a）所示，造成严重资源浪费且会误导用户，严重损害了模型的可靠性（Reliability）。

来自主题: AI技术研报

6700 点击 2025-07-17 11:24

大模型越反思越错，原来是长链推理通过自我说服加重幻觉 | 北邮

当推理链从3步延伸到50+步，幻觉率暴增10倍；反思节点也束手无策。

来自主题: AI技术研报

7213 点击 2025-07-04 09:35

中国首个海洋领域开源大模型OceanGPT(沧渊)发布！海洋精准感知技术全国重点实验室(浙江大学)牵头研发

该大模型由海洋精准感知技术全国重点实验室(浙江大学)牵头研发，具备基础的海洋专业知识问答，以及声呐图像、海洋观测图等海洋特色多模态数据的自然语言解读能力。其采用的领域知识增强“慢思考”推理机制，相较现有通用大模型能有效降低幻觉式错误。

来自主题: AI资讯

5542 点击 2025-06-29 17:03

Claude当上小店店主，不仅经营不善，还一度相信自己是真实人类

Anthropic 最近做了一项相当有趣的研究：让 Claude 管理其办公室的一家自动化商店。Claude 作为小店店主，运营了一个月，过程也是相当跌荡起伏，甚至在其中的一个时间段，Claude 竟然确信自己是一个真实存在的人类，并幻觉了一些并未发生过的事件。

来自主题: AI资讯

6082 点击 2025-06-28 18:04

紫东太初开源视觉神经增强方法，即插即用终结多模态幻觉 | ACL 2025

通过“视觉神经增强”机制，直接放大模型中的视觉关键注意力头输出，显著降低模型的幻觉现象。

来自主题: AI技术研报

6921 点击 2025-06-28 11:25

零开销，消除图像幻觉！基于零空间投影挖掘正常样本特征 | CVPR 2025

当前大型视觉语言模型（LVLMs）存在物体幻觉问题，即会生成图像中不存在的物体描述。

来自主题: AI技术研报

8256 点击 2025-06-27 16:26

放弃幻想！伯克利重磅：消灭幻觉，就是消灭AI！

关于大模型产生幻觉这个事，从2023年GPT火了以后，就一直是业界津津乐道的热门话题，但始终缺乏系统性的重磅研究来深入解释其根本机制。今天，伯克利的研究者们带来一个重要研究成果：让基于Transformer架构的语言模型产生幻觉的机制，恰恰也是让它们拥有超强泛化能力的关键。这就像是一枚硬币的两面，您想要哪一面，就得接受另一面的存在。

来自主题: AI技术研报

6990 点击 2025-06-23 09:47

刚上手AI，职场人就踩了幻觉的坑

豆包、文心一言、DeepSeek、元宝……这些国产AI工具，正在大规模进入职场内容流里。我们以为它们是工具，其实它们更像是一种“说得太像真的语气”，让每个使用者都可能在不经意间交出判断力。

来自主题: AI资讯

7562 点击 2025-05-31 10:16

大风起兮云飞扬：Agent, o3幻觉, 刷榜, 大厂布局深意… | 南乔的月度观察

近半年来，OpenAI 形象开始变得灰暗：团队骨干相继离职引发猜疑、组织转型遭受口诛笔伐、GPT-4.5/Sora 等模型表现不及预期，还有被 DeepSeek R1 打破的叙事神话……

来自主题: AI资讯

9162 点击 2025-05-29 10:56