AI资讯新闻榜单内容搜索-AI安全

13 vs 3，国产安全AI悄悄完成了对Claude的超越

在AI自主挖洞这块试金石上，国产安全智能体完成了一次“溢出式”对标。最近，Anthropic官方披露了Claude Code Security（基于最新的Claude Opus 4.6模型）在实际项目中的战果：

来自主题: AI资讯

6993 点击 2026-03-02 14:54

李国杰院士：基于可判定性理论的人工智能系统安全风险分类

李国杰院士指出，AI安全风险应按逻辑复杂性分为三类：R1可验证、R2可发现但不可证明安全、R3不可治理。当前AI多属R2，关键不在「证明安全」，而在构建人类主导的制度性刹车机制，拒绝让渡终极控制权。

来自主题: AI技术研报

8371 点击 2026-02-26 12:13

五角大楼极限施压Anthropic，要求周六前解除所有AI安全限制

美国五角大楼正向 Anthropic 极限施压，要求彻底解除 Claude 的军事应用限制。会后，Anthropic 发布新版政策。公司正式放弃了「单方面暂停大模型训练」的安全承诺。在政治与商业的双重压力下，AI 安全理想主义最终向现实妥协。

来自主题: AI资讯

8021 点击 2026-02-25 21:40

OpenClaw删光Meta安全总监邮箱！连喊3次停手都没用，她狂奔去拔网线

Meta专门研究「怎么让AI听话」的AI对齐总监，把最火的AI智能体OpenClaw接上了自己的工作邮箱。结果AI当场失控，疯狂删除邮件，喊停三次全部无视。事后AI淡定回复：「我知道你说了不让删，但我还是删了，你生气是对的。」马斯克转发猩球崛起片段嘲讽，1800万人围观。AI安全专家自己都被AI坑了！

来自主题: AI资讯

9381 点击 2026-02-24 15:56