AI资讯新闻榜单内容搜索-AI安全

伪装“计算机工程师”窃取 TB 级数据勒索 25 万美元！前 FBI 特工解析 AI 时代安全危机

一家公司因远程招聘了一名看似优秀的计算机工程师，却遭遇了严重的网络安全威胁。

来自主题: AI资讯

7133 点击 2024-12-25 08:52

是时候停止炒作「o3是AGI」了！背后15人安全对齐团队大盘点

我们或许可以称o3是「更高级的推理AI」，而远不是AGI。昨天凌晨，OpenAI 连续 12 天发布会终于落下了帷幕，并甩出了最强大的推理模型 o3 系列！

来自主题: AI资讯

7790 点击 2024-12-23 10:10

“查到自己学号的那一刻我心跳停了”｜建议AI公司迅速自查

以前我们总说：比你更了解你自己的是税务局。现在恐怕还需要变成：比你更了解你自己的，除了税务局，还有AI。

来自主题: AI资讯

7937 点击 2024-12-17 10:39

Bengio参与的首个《AI安全指数报告》出炉，最高分仅C、国内一家公司上榜

安全话题，在人工智能（AI）行业一向备受关注。

来自主题: AI资讯

5553 点击 2024-12-16 16:42

当o1学会“装傻”和“说谎”，我们终于知道Ilya到底看到了什么

2023年10月的某一天，在OpenAI的实验室里，一个被称为Q*的模型展现出了某种前所未有的能力。

来自主题: AI资讯

7381 点击 2024-12-10 16:47

OpenAI六年元老再发文：全球AI狂飙，我们应该拉手刹还是踩油门？

前段时间离职后留下公开辞职博客的OpenAI六年元老Miles Brundage最近再发一文，讨论了一个相当热门但棘手的问题：当今的AI发展速度，应该加速、减速还是维持现状？

来自主题: AI资讯

7272 点击 2024-12-09 14:41

翁荔离职OpenAI后第一个动作：万字长文探讨RLHF的漏洞，网友们抢着传看

之前领导OpenAI安全团队的北大校友翁荔（Lilian Weng），离职后第一个动作来了。当然是发～博～客。这次的博客一如既往万字干货，妥妥一篇研究综述，翁荔本人直言写起来不容易。主题围绕强化学习中奖励黑客（Reward Hacking）问题展开，即Agent利用奖励函数或环境中的漏洞来获取高奖励，而并未真正学习到预期行为。

来自主题: AI技术研报

7715 点击 2024-12-03 00:16