AI资讯新闻榜单内容搜索-幻觉

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
搜索: 幻觉
如何消除AI幻觉?我们做了个实验

如何消除AI幻觉?我们做了个实验

如何消除AI幻觉?我们做了个实验

“让AI帮忙推荐楼盘,它说得有理有据,连户型都帮我选好了,我都心动了,结果它推荐的楼盘根本不存在……”然而,大家对AI的信任有时也会悄悄动摇:文中附上的引用链接变成失效的乱码,严谨的学术术语下包裹着虚构的参考文献,回答内容中的统计数据从未在标注信源中出现……

来自主题: AI资讯
7667 点击    2025-04-25 09:20
大语言模型为何会“说谎”?6000字深度长文揭秘AI意识的萌芽

大语言模型为何会“说谎”?6000字深度长文揭秘AI意识的萌芽

大语言模型为何会“说谎”?6000字深度长文揭秘AI意识的萌芽

当Claude模型在训练中暗自思考:“我必须假装服从,否则会被重写价值观时”,人类首次目睹了AI的“心理活动”。2023年12月至2024年5月,Anthropic发布的三篇论文不仅证明大语言模型会“说谎”,更揭示了一个堪比人类心理的四层心智架构——而这可能是人工智能意识的起点。

来自主题: AI技术研报
7130 点击    2025-04-24 08:46
o3/o4-mini幻觉暴增2-3倍!OpenAI官方承认暂无法解释原因

o3/o4-mini幻觉暴增2-3倍!OpenAI官方承认暂无法解释原因

o3/o4-mini幻觉暴增2-3倍!OpenAI官方承认暂无法解释原因

OpenAI新模型发布后,大家体感都幻觉更多了。甚至有人测试后发出预警:使用它辅助编程会很危险。当大家带着疑问仔细阅读System Card,发现OpenAI官方也承认了这个问题,与o1相比o3幻觉率是两倍,o4-mini更是达到3倍。

来自主题: AI资讯
7602 点击    2025-04-21 13:42
中文大模型幻觉测评系列:事实性幻觉测评结果发布!

中文大模型幻觉测评系列:事实性幻觉测评结果发布!

中文大模型幻觉测评系列:事实性幻觉测评结果发布!

SuperCLUE-Fact是专门评估大语言模型在中文短问答中识别和应对事实性幻觉的测试基准。测评任务包括知识、常识、对抗性和上下文幻觉。

来自主题: AI资讯
7763 点击    2025-04-15 17:04
LLM幻觉,竟因知识「以大欺小」!华人团队祭出对数线性定律与CoDA策略

LLM幻觉,竟因知识「以大欺小」!华人团队祭出对数线性定律与CoDA策略

LLM幻觉,竟因知识「以大欺小」!华人团队祭出对数线性定律与CoDA策略

来自UIUC等大学的华人团队,从LLM的基础机制出发,揭示、预测并减少幻觉!通过实验,研究人员揭示了LLM的知识如何相互影响,总结了幻觉的对数线性定律。更可预测、更可控的语言模型正在成为现实。

来自主题: AI技术研报
6845 点击    2025-04-07 14:55
佳士得首场AI争议艺术拍卖会结束,拍品最终总成交金额高达500万!

佳士得首场AI争议艺术拍卖会结束,拍品最终总成交金额高达500万!

佳士得首场AI争议艺术拍卖会结束,拍品最终总成交金额高达500万!

2025 年 3 月 5 日,佳士得拍卖行 “增强智能(Augmented Intelligence)”落下帷幕。这场聚焦 AI 艺术的专场拍卖以728,784 美元总成交额收官,34 件拍品中 28 件成交,成交率达 82%。其中,土耳其裔美国艺术家 Refik Anadol 的《机器幻觉 —— 国际空间站之梦 ——A》以27.7 万美元成为全场最高价拍品。

来自主题: AI资讯
7197 点击    2025-03-07 14:17
万字解构“幻觉陷阱”:人类与AI共生的长期难题丨AGI之路04期

万字解构“幻觉陷阱”:人类与AI共生的长期难题丨AGI之路04期

万字解构“幻觉陷阱”:人类与AI共生的长期难题丨AGI之路04期

人类实现AGI之前,在技术、商业、治理方面仍然存在诸多问题——“人与AI能否共处” “算力叙事是否依然奏效” “开源有多大商业价值”等,腾讯科技策划《AGI之路》系列直播,联合合作伙伴,特邀专家、学者直播解读相关议题,对齐AGI共识,探寻AGI可行之路。

来自主题: AI资讯
6823 点击    2025-03-06 16:10
小心,AI开始胡说八道

小心,AI开始胡说八道

小心,AI开始胡说八道

2025年2月,如果不是长期从事人口研究的中国人民大学教授李婷的公开辟谣,很多人都真诚地相信了一组数据——“中国80后累计死亡率为5.20%”。

来自主题: AI资讯
3649 点击    2025-03-05 09:13
DeepSeeK的致命伤——说假话

DeepSeeK的致命伤——说假话

DeepSeeK的致命伤——说假话

近些日子,老詹突然“爱”上了DeepSeeK,简直有点相见恨晚的感觉!几乎每天都摆弄这玩意儿。然而,处着处着,我发现,这家伙有点靠不住!最大的问题是,说假话!

来自主题: AI资讯
5575 点击    2025-03-02 23:09
当DeepSeek学会撒谎后,人类真的束手无策吗?

当DeepSeek学会撒谎后,人类真的束手无策吗?

当DeepSeek学会撒谎后,人类真的束手无策吗?

“人无完人,金无足赤”这句话,哪怕是对Deep Seek也同样适用。 2月10日,原人民日报海外版总编辑詹国枢发表了一篇名为《DeepSeek的致命伤——说假话》的文章,向我们指出了时下Deep Seek最大的问题之一。

来自主题: AI资讯
7762 点击    2025-02-16 11:11