AI资讯新闻榜单内容搜索-ai安全

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: ai安全
OpenClaw们狂奔,谁来焊死安全车门?

OpenClaw们狂奔,谁来焊死安全车门?

OpenClaw们狂奔,谁来焊死安全车门?

OpenClaw、Moltbook彻底火了。

来自主题: AI资讯
9578 点击    2026-02-03 08:43
ClawdBot,正在引爆全球灾难!各大CEO预警:不要安装,不要安装

ClawdBot,正在引爆全球灾难!各大CEO预警:不要安装,不要安装

ClawdBot,正在引爆全球灾难!各大CEO预警:不要安装,不要安装

一夜爆红的ClawdBot,正在把无数公司和个人推向深渊:端口裸奔、无鉴权、可被远程接管。现在,暴力破解、数据清空已经真实发生了,这不是危言耸听。各位CEO纷纷预警:ClawdBot,正在酝酿一场全球灾难!

来自主题: AI资讯
6833 点击    2026-01-28 15:31
第一梯队的大模型安全吗?复旦、上海创智学院等发布前沿大模型安全报告,覆盖六大领先模型

第一梯队的大模型安全吗?复旦、上海创智学院等发布前沿大模型安全报告,覆盖六大领先模型

第一梯队的大模型安全吗?复旦、上海创智学院等发布前沿大模型安全报告,覆盖六大领先模型

随着大语言模型加速迈向多模态与智能体形态,传统以单一维度为主的安全评估体系已难以覆盖真实世界中的复杂风险图景。在模型能力持续跃升的 2026 年,开发者与用户也愈发关注一个核心问题:前沿大模型的安全性,到底如何?

来自主题: AI技术研报
9219 点击    2026-01-26 10:20
Anthropic正式开源了Claude的「灵魂」—— Claude's Constitution

Anthropic正式开源了Claude的「灵魂」—— Claude's Constitution

Anthropic正式开源了Claude的「灵魂」—— Claude's Constitution

今天,Anthropic 试图向世界展示它的灵魂。Anthropic 正式公布了一份长达 84 页的特殊文档——《Claude 宪法》(Claude's Constitution)。这份文件并非通常意义上的技术白皮书或用户协议,而是一份直接面向 AI 模型本身「撰写」的价值观宣言。

来自主题: AI资讯
8489 点击    2026-01-22 21:06
Anthropic公布新技术:不靠删数据,参数隔离移除AI危险

Anthropic公布新技术:不靠删数据,参数隔离移除AI危险

Anthropic公布新技术:不靠删数据,参数隔离移除AI危险

近年来,大语言模型的能力突飞猛进,但随之而来的却是愈发棘手的双重用途风险(dual-use risks)。当模型在海量公开互联网数据中学习时,它不仅掌握语言与推理能力,也不可避免地接触到 CBRN(化学、生物、放射、核)危险制造、软件漏洞利用等高敏感度、潜在危险的知识领域。

来自主题: AI技术研报
8649 点击    2025-12-25 10:21
OpenAI这招太狠!AI从「躲猫猫」到「自爆黑料」,主打一个坦白

OpenAI这招太狠!AI从「躲猫猫」到「自爆黑料」,主打一个坦白

OpenAI这招太狠!AI从「躲猫猫」到「自爆黑料」,主打一个坦白

随着AI越来越强大并进入更高风险场景,透明、安全的AI显得越发重要。OpenAI首次提出了一种「忏悔机制」,让模型的幻觉、奖励黑客乃至潜在欺骗行为变得更加可见。

来自主题: AI技术研报
6995 点击    2025-12-23 09:26