AI资讯新闻榜单内容搜索-幻觉

从第一性原理出发的RAG推理新范式来了，蚂蚁DIVER登顶权威基准

在当前由大语言模型（LLM）驱动的技术范式中，检索增强生成（RAG）已成为提升模型知识能力与缓解「幻觉」的核心技术。然而，现有 RAG 系统在面对需多步逻辑推理任务时仍存在显著局限，具体挑战如下：

来自主题: AI技术研报

8987 点击 2025-09-10 11:07

OpenAI新幻觉论文惹争议！GPT-5拉胯是测试基准有问题？？

OpenAI好不容易发了篇新论文，还是给GPT-5挽尊？

来自主题: AI资讯

8366 点击 2025-09-09 12:52

AI里最大的Bug，却也是人类文明最伟大的起点。

周末在家扒拉上周更新的论文的时候，看到一篇我自己一直非常关心的领域的论文，而且还是来自发论文发的越来越少的OpenAI。

来自主题: AI资讯

7036 点击 2025-09-08 09:44

OpenAI重组GPT-5「灵魂」团队！亚裔女负责人遭调离，罕见自曝AI幻觉祸首

OpenAI重磅结构调整：ChatGPT「模型行为」团队并入Post-Training，前负责人Joanne Jang负责新成立的OAI Labs。而背后原因，可能是他们最近的新发现：评测在奖励模型「幻觉」，模型被逼成「应试选手」。一次组织重组+评测范式重构，也许正在改写AI的能力边界与产品形态。

来自主题: AI技术研报

8474 点击 2025-09-07 12:20

OpenAI罕见发论文：我们找到了AI幻觉的罪魁祸首

AI 最臭名昭著的 Bug 是什么？不是代码崩溃，而是「幻觉」—— 模型自信地编造事实，让你真假难辨。这个根本性挑战，是阻碍我们完全信任 AI 的关键障碍。

来自主题: AI技术研报

6422 点击 2025-09-07 11:21

OpenAI和Anthropic罕见互评模型：Claude幻觉明显要低

罕见，着实是太罕见。一觉醒来，AI圈的两大顶流——OpenAI和Anthropic，竟然破天荒地联手合作了。

来自主题: AI资讯

7900 点击 2025-08-29 13:01

GPT正面对决Claude！OpenAI竟没全赢，AI安全「极限大测」真相曝光

OpenAI和Anthropic罕见合作！因为AI安全「分手」后，这次双方却因为安全合作：测试双方模型在幻觉等四大安全方面的具体表现。这场合作，不仅是技术碰撞，更是AI安全的里程碑，百万用户每天的互动，正推动安全边界不断扩展。

来自主题: AI资讯

8657 点击 2025-08-28 23:04

GPT-5变蠢背后：抑制AI的幻觉，反而让模型没用了？

OpenAI的GPT-5因大幅降低AI幻觉而被批"变蠢"，输出呆板创造力减弱，反映出幻觉降低限制模型灵活性。对话嘉宾甄焱鲲分析幻觉本质无法根除，需辩证看待，并探讨类型分5类、缓解方法如In-Context-Learning及RAG，影响企业应用场景的容忍度与决策，强调未来模型或通过世界模型深化理解。

来自主题: AI资讯

8793 点击 2025-08-23 10:32

ChatGPT精神病：那些和人工智能聊天后发疯的人

在人工智能技术迅速迭代的当下，一种新的幻觉机制正在悄然成型。

来自主题: AI资讯

7524 点击 2025-08-18 18:19

别再被 AI 写作绑架了，写过多篇爆文后我发现：99% 的人都用错了方法

在 AI 工具层出不穷的当下，很多人开始尝试用一个 AI 写故事、编脚本、润色文案。但对于日常需要写稿、整理内容的工作者来说，一个「替你写」的 AI，未必是最优解。幻觉、记忆、上下文，都是问题。

来自主题: AI资讯

7173 点击 2025-08-18 18:12