AI资讯新闻榜单内容搜索-AI安全

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: AI安全
管你模型多大,250份有毒文档统统放倒,Anthropic:迄今为止规模最大的大模型数据投毒调查

管你模型多大,250份有毒文档统统放倒,Anthropic:迄今为止规模最大的大模型数据投毒调查

管你模型多大,250份有毒文档统统放倒,Anthropic:迄今为止规模最大的大模型数据投毒调查

本次新研究是迄今为止规模最大的大模型数据投毒调查。Anthropic 与英国人工智能安全研究所(UK AI Security Institute)和艾伦・图灵研究所(Alan Turing Institute)联合进行的一项研究彻底打破了这一传统观念:只需 250 份恶意文档就可能在大型语言模型中制造出「后门」漏洞,且这一结论与模型规模或训练数据量无关。

来自主题: AI技术研报
7522 点击    2025-10-10 12:14
ICCV 25 Highlight | 扩散过程「早预警」实现6x加速,AIGC生图的高效后门防御

ICCV 25 Highlight | 扩散过程「早预警」实现6x加速,AIGC生图的高效后门防御

ICCV 25 Highlight | 扩散过程「早预警」实现6x加速,AIGC生图的高效后门防御

随着 AIGC 图像生成技术的流行,后门攻击给开源社区的繁荣带来严重威胁,然而传统分类模型的后门防御技术无法适配 AIGC 图像生成。

来自主题: AI技术研报
6865 点击    2025-09-25 15:02
Claude Code被攻破「后门」,港科大&复旦研究曝出TIP漏洞

Claude Code被攻破「后门」,港科大&复旦研究曝出TIP漏洞

Claude Code被攻破「后门」,港科大&复旦研究曝出TIP漏洞

在 AI 辅助编程领域,Anthropic 推出的 Claude Code 命令行工具已成为开发者常用的助手。它允许从终端直接调用 Claude Sonnet 等模型,处理脚本编写、代码调试和系统命令执行等任务。

来自主题: AI技术研报
5805 点击    2025-09-24 09:53
国内首个大模型“体检”结果发布,这样问AI很危险!

国内首个大模型“体检”结果发布,这样问AI很危险!

国内首个大模型“体检”结果发布,这样问AI很危险!

近日,国内首次针对AI大模型的实网众测结果正式公布,一场大型“安全体检”透露出不容忽视的信号:本次活动累计发现安全漏洞281个,其中大模型特有漏洞高达177个,占比超过六成,这组数据表明,AI正面临着超出传统安全范畴的新型威胁。

来自主题: AI资讯
5601 点击    2025-09-23 10:27
阿里新开源提出建设性安全对齐方案,向“让用AI的人安全”新范式跃迁

阿里新开源提出建设性安全对齐方案,向“让用AI的人安全”新范式跃迁

阿里新开源提出建设性安全对齐方案,向“让用AI的人安全”新范式跃迁

阿里巴巴集团安全部联合清华大学、复旦大学、东南大学、新加坡南洋理工等高校,联合发布技术报告;其理念与最近OpenAI发布的GPT-5 System Card放在首位的“From Hard Refusals to Safe-Completions”理念不谋而合。

来自主题: AI技术研报
6050 点击    2025-09-21 11:09
Hinton最新警告:杀手机器人或将带来更多战争,最大担忧是AI接管人类

Hinton最新警告:杀手机器人或将带来更多战争,最大担忧是AI接管人类

Hinton最新警告:杀手机器人或将带来更多战争,最大担忧是AI接管人类

近日,「AI教父」Geoffrey Hinton在一次采访中再发预警:「杀手机器人」「无人机」等致命自主武器的兴起,正在让战争变得更易发动。Hinton认为OpenAI、Anthropic等许多AI公司在AI安全方面做得都不够。他还谈到了贪婪、自负等人性弱点,对AI研究可能带来的潜在风险。

来自主题: AI资讯
6746 点击    2025-09-04 11:21
最后通牒!Claude聊天/代码「默认」全喂AI训练,你的隐私能被用5年

最后通牒!Claude聊天/代码「默认」全喂AI训练,你的隐私能被用5年

最后通牒!Claude聊天/代码「默认」全喂AI训练,你的隐私能被用5年

近日,Anthropic更新了它的消费者条款,没想竟把网友惹怒了,有的还把以往的「旧账」都翻了出来。这次网友的反应为啥这么激烈?大家可能还记得在Claude上线之初,Anthropic就坚决表示不会拿用户数据来训练模型。这次变化不仅自己打脸,还把以往一些「背刺」用户的往事都抖搂出来了。

来自主题: AI资讯
7882 点击    2025-08-31 13:31
Ilya信徒逆袭!23岁天才被OpenAI开除,靠165页AI预言书撬动15亿美金

Ilya信徒逆袭!23岁天才被OpenAI开除,靠165页AI预言书撬动15亿美金

Ilya信徒逆袭!23岁天才被OpenAI开除,靠165页AI预言书撬动15亿美金

他曾是Ilya的亲信,因揭露OpenAI安全隐患被解雇,却在短短6个月内以47%回报打造出管理规模15亿美元的基金。作为AI安全激进派,他在165页论文《Situational Awareness》中预测2027年将迎来AGI,并呼吁建立「AI版曼哈顿计划」。

来自主题: AI资讯
6577 点击    2025-08-30 18:40
Claude开始“吃用户”了,收你数据训模型,不同意30天就删你记录

Claude开始“吃用户”了,收你数据训模型,不同意30天就删你记录

Claude开始“吃用户”了,收你数据训模型,不同意30天就删你记录

这是 Claude(Anthropic 的 AI 助手)今天更新了用户条款和隐私政策: 允许 Claude 使用你的聊天内容和编程会话,用于训练和改进 AI 模型。 默认是“同意”,可以手动去设置关闭。而且是要求用户在 2025 年 9 月 28 日前作出选择。

来自主题: AI资讯
6717 点击    2025-08-30 12:39