AI资讯新闻榜单内容搜索-Anthropic论

Anthropic最新论文撬开大模型黑箱：隐藏动机发现率提升 4 倍以上

刚刚，Anthropic 发布论文《Natural Language Autoencoders Produce Unsupervised Explanations of LLM Activations》，试图用一套自然语言自动编码器（Natural Language Autoencoders，下文简称 NLA），撬开这个黑箱。

来自主题: AI技术研报

9818 点击 2026-05-08 14:33

AI安全得查祖宗三代？Anthropic登Nature揭秘大模型潜意识传染

AI模型只看了一串纯数字序列，就能继承另一个模型的危险偏好，即使删掉敏感词没有用，合成数据时代最隐蔽的安全裂缝，被撕开了。

来自主题: AI技术研报

9029 点击 2026-04-17 08:40

Claude爆火研究漏引华人团队成果，已挨打立正道歉

Anthropic新论文漏引同行工作，被抓包并贴脸质疑了。

来自主题: AI技术研报

6892 点击 2026-04-08 17:30

坏了，我成AI的乙方了！Anthropic论文爆火，谁还敢无脑Copy？

Anthropic杀疯了！开年第一篇论文直接化身自爆卡车，实锤AI正在让程序员变傻。你以为效率提高了？其实只快了2分钟。

来自主题: AI资讯

9869 点击 2026-04-08 09:13