AI资讯新闻榜单内容搜索-幻觉

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 幻觉
OpenAI重组GPT-5「灵魂」团队!亚裔女负责人遭调离,罕见自曝AI幻觉祸首

OpenAI重组GPT-5「灵魂」团队!亚裔女负责人遭调离,罕见自曝AI幻觉祸首

OpenAI重组GPT-5「灵魂」团队!亚裔女负责人遭调离,罕见自曝AI幻觉祸首

OpenAI重磅结构调整:ChatGPT「模型行为」团队并入Post-Training,前负责人Joanne Jang负责新成立的OAI Labs。而背后原因,可能是他们最近的新发现:评测在奖励模型「幻觉」,模型被逼成「应试选手」。一次组织重组+评测范式重构,也许正在改写AI的能力边界与产品形态。

来自主题: AI技术研报
9268 点击    2025-09-07 12:20
OpenAI罕见发论文:我们找到了AI幻觉的罪魁祸首

OpenAI罕见发论文:我们找到了AI幻觉的罪魁祸首

OpenAI罕见发论文:我们找到了AI幻觉的罪魁祸首

AI 最臭名昭著的 Bug 是什么?不是代码崩溃,而是「幻觉」—— 模型自信地编造事实,让你真假难辨。这个根本性挑战,是阻碍我们完全信任 AI 的关键障碍。

来自主题: AI技术研报
7068 点击    2025-09-07 11:21
OpenAI和Anthropic罕见互评模型:Claude幻觉明显要低

OpenAI和Anthropic罕见互评模型:Claude幻觉明显要低

OpenAI和Anthropic罕见互评模型:Claude幻觉明显要低

罕见,着实是太罕见。 一觉醒来,AI圈的两大顶流——OpenAI和Anthropic,竟然破天荒地联手合作了。

来自主题: AI资讯
8410 点击    2025-08-29 13:01
GPT正面对决Claude!OpenAI竟没全赢,AI安全「极限大测」真相曝光

GPT正面对决Claude!OpenAI竟没全赢,AI安全「极限大测」真相曝光

GPT正面对决Claude!OpenAI竟没全赢,AI安全「极限大测」真相曝光

OpenAI和Anthropic罕见合作!因为AI安全「分手」后,这次双方却因为安全合作:测试双方模型在幻觉等四大安全方面的具体表现。这场合作,不仅是技术碰撞,更是AI安全的里程碑,百万用户每天的互动,正推动安全边界不断扩展。

来自主题: AI资讯
9305 点击    2025-08-28 23:04
GPT-5变蠢背后:抑制AI的幻觉,反而让模型没用了?

GPT-5变蠢背后:抑制AI的幻觉,反而让模型没用了?

GPT-5变蠢背后:抑制AI的幻觉,反而让模型没用了?

OpenAI的GPT-5因大幅降低AI幻觉而被批"变蠢",输出呆板创造力减弱,反映出幻觉降低限制模型灵活性。对话嘉宾甄焱鲲分析幻觉本质无法根除,需辩证看待,并探讨类型分5类、缓解方法如In-Context-Learning及RAG,影响企业应用场景的容忍度与决策,强调未来模型或通过世界模型深化理解。

来自主题: AI资讯
9519 点击    2025-08-23 10:32
ChatGPT精神病:那些和人工智能聊天后发疯的人

ChatGPT精神病:那些和人工智能聊天后发疯的人

ChatGPT精神病:那些和人工智能聊天后发疯的人

在人工智能技术迅速迭代的当下,一种新的幻觉机制正在悄然成型。

来自主题: AI资讯
8238 点击    2025-08-18 18:19
别再被 AI 写作绑架了,写过多篇爆文后我发现:99% 的人都用错了方法

别再被 AI 写作绑架了,写过多篇爆文后我发现:99% 的人都用错了方法

别再被 AI 写作绑架了,写过多篇爆文后我发现:99% 的人都用错了方法

在 AI 工具层出不穷的当下,很多人开始尝试用一个 AI 写故事、编脚本、润色文案。但对于日常需要写稿、整理内容的工作者来说,一个「替你写」的 AI,未必是最优解。幻觉、记忆、上下文,都是问题。

来自主题: AI资讯
7893 点击    2025-08-18 18:12
LLM幻觉第一次被定义:你必须掌握的3个理论和能上手的4套工程解法

LLM幻觉第一次被定义:你必须掌握的3个理论和能上手的4套工程解法

LLM幻觉第一次被定义:你必须掌握的3个理论和能上手的4套工程解法

幻觉,作为AI圈家喻户晓的概念,这个词您可能已经听得耳朵起茧了。我们都知道它存在,也普遍接受了它似乎无法根除,是一个“老大难”问题。但正因如此,一个更危险的问题随之而来:当我们对幻觉的存在习以为常时,我们是否也开始对它背后的系统性风险变得麻木?我们是真的从第一性原理上理解了它,还是仅仅在用一个又一个的补丁(比如RAG)来被动地应对它?

来自主题: AI资讯
7966 点击    2025-08-15 11:03
GPT-oss太离谱:无提示自行想象编程问题,还重复求解5000次

GPT-oss太离谱:无提示自行想象编程问题,还重复求解5000次

GPT-oss太离谱:无提示自行想象编程问题,还重复求解5000次

GPT-oss放飞自我了?!居然出现了明显的幻觉行为。 在没有提示词的情况下,消耗超过30000个token凭空想出一个问题,还反复求解了5000多次?!

来自主题: AI资讯
7200 点击    2025-08-12 11:52
首部法律LLM全景综述发布!双重视角分类法、技术进展与伦理治理

首部法律LLM全景综述发布!双重视角分类法、技术进展与伦理治理

首部法律LLM全景综述发布!双重视角分类法、技术进展与伦理治理

研究人员首次系统综述了大型语言模型(LLM)在法律领域的应用,提出创新的双重视角分类法,融合法律推理框架(经典的法律论证型式框架)与职业本体(律师/法官/当事人角色),统一梳理技术突破与伦理治理挑战。论文涵盖LLM在法律文本处理、知识整合、推理形式化方面的进展,并指出幻觉、可解释性缺失、跨法域适应等核心问题,为下一代法律人工智能奠定理论基础与实践路线图。

来自主题: AI资讯
7557 点击    2025-08-01 11:51