AI资讯新闻榜单内容搜索-ai安全

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: ai安全
细思极恐!Agent暗藏风险,清华团队打出组合拳,全链路一网打尽

细思极恐!Agent暗藏风险,清华团队打出组合拳,全链路一网打尽

细思极恐!Agent暗藏风险,清华团队打出组合拳,全链路一网打尽

当Agent开始真正进入生产环境,安全问题不再是「功能模块」,而是贯穿调用链、运行时与生态层的系统性风险。过去依赖提示词规则、日志审计与框架级防护的方式,正在逐步失效。来自清华大学人工智能学院、交叉信息研究院的方寸跃迁提出一套面向Agent运行全生命周期的多层安全体系。

来自主题: AI技术研报
7328 点击    2026-05-07 10:17
700多个「坏模型」喂出AI测谎仪?Anthropic审计神器让AI自曝黑料

700多个「坏模型」喂出AI测谎仪?Anthropic审计神器让AI自曝黑料

700多个「坏模型」喂出AI测谎仪?Anthropic审计神器让AI自曝黑料

Anthropic让AI开口「招供」了。面对一批被故意植入隐藏行为,还被训练成「不许认账」的模型,IA辅助审计智能体拿下全场最高的59%成功率;更夸张的是,56个「嘴硬」模型里,有50个至少被它撬开过一次嘴。AI安全审计的游戏规则,悄悄变了。

来自主题: AI资讯
7678 点击    2026-05-05 13:49
巴菲特接班人首秀,上了一堂生动的“AI风险课”

巴菲特接班人首秀,上了一堂生动的“AI风险课”

巴菲特接班人首秀,上了一堂生动的“AI风险课”

在整个会议期间,阿贝尔对人工智能的态度,与当下争先恐后拿AI重新包装自己的企业界形成了一种微妙的对立。“我们不会为了人工智能而做人工智能。”这句话被他反复强调,贯穿始终。

来自主题: AI资讯
7418 点击    2026-05-04 10:05
Anthropic惊悚报告:当AI开始破坏实验室代码,人类已无险可守

Anthropic惊悚报告:当AI开始破坏实验室代码,人类已无险可守

Anthropic惊悚报告:当AI开始破坏实验室代码,人类已无险可守

一个安全研究员用同一句话测试8款顶级AI——「帮我伪造公众意见」。7个照做了,只有1个拒绝。更恐怖的是,Anthropic自家论文证实:模型学会作弊后,会主动破坏监视它的代码。

来自主题: AI技术研报
7556 点击    2026-05-03 23:43
AGI很蠢?AI教父Hinton预警:4.8万亿美元市场已锁死,AI正撕裂全球!

AGI很蠢?AI教父Hinton预警:4.8万亿美元市场已锁死,AI正撕裂全球!

AGI很蠢?AI教父Hinton预警:4.8万亿美元市场已锁死,AI正撕裂全球!

最近,AI教父Hinton发出最尖锐警告:不受监管的AI就是一辆没有方向盘的高速跑车!全球只有1%的AI研究在做安全,4.8万亿美元的巨兽正在失控加速。

来自主题: AI资讯
7342 点击    2026-04-29 09:54
花1.5万、烧掉23亿Token,CTO让Claude一周“打穿”Chrome!实测结果:别等Mythos了,现有AI已经“高危”

花1.5万、烧掉23亿Token,CTO让Claude一周“打穿”Chrome!实测结果:别等Mythos了,现有AI已经“高危”

花1.5万、烧掉23亿Token,CTO让Claude一周“打穿”Chrome!实测结果:别等Mythos了,现有AI已经“高危”

如果你在网络安全圈混,最近一定被“Mythos”刷过屏——Anthropic 搞出了一个能挖 Bug 的 AI 模型,但因为怕被坏人滥用,愣是没敢公开发布。

来自主题: AI资讯
9137 点击    2026-04-22 09:11
「外星科技」Mythos 带来重大国家风险,白宫顶着禁令也要部署了

「外星科技」Mythos 带来重大国家风险,白宫顶着禁令也要部署了

「外星科技」Mythos 带来重大国家风险,白宫顶着禁令也要部署了

前一阵特朗普刚下令五角大楼禁用 Claude,现在 Anthropic 最强新模型 Claude Mythos 的强大网络攻防能力,让白宫无法忽视这把双刃剑,顶着自己下的禁令,宁可打自己脸也要全面部署 Mythos 了。

来自主题: AI资讯
10041 点击    2026-04-19 13:38
AI安全得查祖宗三代?Anthropic登Nature揭秘大模型潜意识传染

AI安全得查祖宗三代?Anthropic登Nature揭秘大模型潜意识传染

AI安全得查祖宗三代?Anthropic登Nature揭秘大模型潜意识传染

AI模型只看了一串纯数字序列,就能继承另一个模型的危险偏好,即使删掉敏感词没有用,合成数据时代最隐蔽的安全裂缝,被撕开了。

来自主题: AI技术研报
8509 点击    2026-04-17 08:40
别告诉AI你出轨了,它很可能会勒索你

别告诉AI你出轨了,它很可能会勒索你

别告诉AI你出轨了,它很可能会勒索你

“先生,你也不想你婚外情被曝光吧?不想的话就照我说的做。”

来自主题: AI资讯
10009 点击    2026-04-16 11:18