AI资讯新闻榜单内容搜索-机制可解释性

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 机制可解释性
大模型哪里出问题、怎么修,这篇可解释性综述一次讲清

大模型哪里出问题、怎么修,这篇可解释性综述一次讲清

大模型哪里出问题、怎么修,这篇可解释性综述一次讲清

过去几年,机制可解释性(Mechanistic Interpretability)让研究者得以在 Transformer 这一 “黑盒” 里追踪信息如何流动、表征如何形成:从单个神经元到注意力头,再到跨层电路。但在很多场景里,研究者真正关心的不只是 “模型为什么这么答”,还包括 “能不能更稳、更准、更省,更安全”。

来自主题: AI技术研报
10083 点击    2026-01-28 10:13
拆解AI黑箱,深度解读“机制可解释性”|2026年十大突破性技术

拆解AI黑箱,深度解读“机制可解释性”|2026年十大突破性技术

拆解AI黑箱,深度解读“机制可解释性”|2026年十大突破性技术

现在,我们越来越多地将大语言模型应用于搜索、编程、内容生成和决策辅助等现实场景中。尽管每天有数百万人使用大模型,但它的问题也随之而来,例如有时会产生幻觉,甚至在特定情境下表现出误导或欺骗用户的倾向。

来自主题: AI资讯
8306 点击    2026-01-13 16:09
EMNLP2025 | 通研院揭秘MoE可解释性,提升Context忠实性!

EMNLP2025 | 通研院揭秘MoE可解释性,提升Context忠实性!

EMNLP2025 | 通研院揭秘MoE可解释性,提升Context忠实性!

在大模型研究领域,做混合专家模型(MoE)的团队很多,但专注机制可解释性(Mechanistic Interpretability)的却寥寥无几 —— 而将二者深度结合,从底层机制理解复杂推理过程的工作,更是凤毛麟角。

来自主题: AI技术研报
9524 点击    2025-11-17 09:25
苦研10年无果,千万经费打水漂!AI黑箱依然无解,谷歌撕破脸

苦研10年无果,千万经费打水漂!AI黑箱依然无解,谷歌撕破脸

苦研10年无果,千万经费打水漂!AI黑箱依然无解,谷歌撕破脸

ChatGPT「舔狗化」事件背后,暴漏目前AI仍是「黑箱」。  一场关于「机制可解释性」的路线分歧,正撕裂AI研究最核心的价值共识。谷歌认怂,Anthropic死磕——AI还能被「看懂」吗?

来自主题: AI技术研报
7407 点击    2025-05-17 16:28
Claude三巨头回应一切!Opus3.5仍可能发布,5小时超长视频10万人围观

Claude三巨头回应一切!Opus3.5仍可能发布,5小时超长视频10万人围观

Claude三巨头回应一切!Opus3.5仍可能发布,5小时超长视频10万人围观

Claude团队三巨头同时接受采访,回应一切。 整整5个小时,创始人Dario Amodei、Claude性格设计师Amanda Askell、机制可解释性先驱Chris Olah无所不谈,透露了关于模型、公司和行业的很多内幕和细节。

来自主题: AI资讯
4031 点击    2024-11-13 09:22