AI资讯新闻榜单内容搜索-幻觉

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 幻觉
GPT在模仿人类?Nature发现:大脑才是最早的Transformer!

GPT在模仿人类?Nature发现:大脑才是最早的Transformer!

GPT在模仿人类?Nature发现:大脑才是最早的Transformer!

我们以为语言是语法、规则、结构。但最新的Nature研究却撕开了这层幻觉。GPT的层级结构与竟与人大脑里的「时间印记」一模一样。当浅层、中层、深层在脑中依次点亮,我们第一次看见:理解语言,也许从来不是解析,而是预测。

来自主题: AI技术研报
8749 点击    2025-12-12 09:39
北大新作EvoVLA:大幅降低机器人幻觉,长序列成功率暴涨10%

北大新作EvoVLA:大幅降低机器人幻觉,长序列成功率暴涨10%

北大新作EvoVLA:大幅降低机器人幻觉,长序列成功率暴涨10%

具身智能的「ChatGPT时刻」还没到,机器人的「幻觉」却先来了?在需要几十步操作的长序列任务中,现有的VLA模型经常「假装在干活」,误以为任务完成。针对这一痛点,北京大学团队提出自进化VLA框架EvoVLA。该模型利用Gemini生成「硬负样本」进行对比学习,配合几何探索与长程记忆,在复杂任务基准Discoverse-L上将成功率提升了10.2%,并将幻觉率从38.5%大幅降至14.8%。

来自主题: AI技术研报
7615 点击    2025-11-29 09:58
210亿美元的幻觉?奥特曼投了一家核能初创

210亿美元的幻觉?奥特曼投了一家核能初创

210亿美元的幻觉?奥特曼投了一家核能初创

在AI热潮里,故事比技术更值钱。一家名为Oklo的核能初创公司,靠着一个概念,市值飙到210亿美元;另一边,一个从SpaceX离职的工程师,让AI自己画电路板,几分钟搞定工程师三天的工作。一个靠叙事吸引资金,一个用技术推动生产。AI热潮下,这两家公司代表着同一时代的两种姿态——造梦,和造物。

来自主题: AI资讯
9635 点击    2025-11-20 16:23
9.9元用AI“复活”亲人:是技术的安慰,还是情感的幻觉?

9.9元用AI“复活”亲人:是技术的安慰,还是情感的幻觉?

9.9元用AI“复活”亲人:是技术的安慰,还是情感的幻觉?

“我活到 108 岁,试茶 80 多年了。” 2025 年 10 月,已故八年的“茶界泰斗”张天福再次“开口”,为福建张天福品牌管理有限公司代言。 张天福之子张德友称此举已获合法授权,而遗孀张晓红则痛

来自主题: AI资讯
8104 点击    2025-11-15 14:46
曝OpenAI布道黑幕!MIT华人记者:他用全人类未来,赌一个AGI神话

曝OpenAI布道黑幕!MIT华人记者:他用全人类未来,赌一个AGI神话

曝OpenAI布道黑幕!MIT华人记者:他用全人类未来,赌一个AGI神话

当硅谷把「AGI造福全人类」包装成信仰时,真实世界却在付出代价。Karen Hao在《Empire of AI》犀利指出,这场竞赛甚至被渲染成「中美对抗」——只要跑赢中国,就能守护自由。但事实是,美国与中国差距并未拉大,唯一真正收割的,是硅谷自己。我们是否还要为这场幻觉买单?

来自主题: AI资讯
9955 点击    2025-11-11 15:29
改掉幻觉=杀死AI?Science曝光大模型「先天死穴」

改掉幻觉=杀死AI?Science曝光大模型「先天死穴」

改掉幻觉=杀死AI?Science曝光大模型「先天死穴」

《Science》的一篇新文章指出,大模型存在一个先天难解的软肋:幻觉难以根除。AI厂商让大模型在不确定性情况下说「我不知道」,虽然有助于减少模型幻觉,但可能因此影响用户留存与活跃度,动摇商业根本。

来自主题: AI技术研报
8749 点击    2025-11-09 15:35
看似万能的 AI,其实比你想的更脆弱和邪恶

看似万能的 AI,其实比你想的更脆弱和邪恶

看似万能的 AI,其实比你想的更脆弱和邪恶

十月,《纽约时报》发表了题为《The A.I. Prompt That Could End the World》(《那个可能终结世界的 AI 提示词》)的文章。作者 Stephen Witt 采访了多位业内人士:有 AI 先驱,图灵奖获奖者 Yoshua Bengio;以越狱测试著称的 Leonard Tang;以及专门研究模型欺骗的 Marius Hobbhahn。

来自主题: AI技术研报
9102 点击    2025-10-27 15:58
医疗幻觉率比DeepSeek低3倍,百川循证增强大模型横扫全球医学考试!

医疗幻觉率比DeepSeek低3倍,百川循证增强大模型横扫全球医学考试!

医疗幻觉率比DeepSeek低3倍,百川循证增强大模型横扫全球医学考试!

时隔两月,Baichuan-M2 Plus重磅出世!成为业内首个循证增强的医疗大模型,幻觉要比DeepSeek-R1低3倍,可信度比肩资深临床专家。新模型将「循证医学」理念深度融入训练和推理,通过首创「六源循证范式」,模拟人类医生思维,有效辨别不同层级医学证据、评估其可靠性,并在回答中优先引用高等级证据。

来自主题: AI资讯
8327 点击    2025-10-23 12:47