AI资讯新闻榜单内容搜索-AI欺骗

当AI学会欺骗，我们该如何应对？

前沿模型越来越多地被训练和部署为自主智能体。一个安全担忧是，AI智能体可能会隐秘地追求与人类目标不一致的目标，隐藏其真实能力和目的——这也被称为AI欺骗或谋划行为（AI deception or scheming）。

来自主题: AI资讯

11908 点击 2025-07-24 11:34

图灵奖得主Yoshua Bengio重磅官宣创办非营利机构LawZero，致力研发「设计即安全」的AI系统，以对抗AI军备竞赛带来的风险。主张构建不具行动性、以理解世界为目标的可信AI。

来自主题: AI资讯

7580 点击 2025-06-04 14:53

又一科幻场景步入现实！GPT-4竟和多个AI模型私自串通一气，欲要形成垄断的资本寡头联合定价。在被哈佛PSU团队抓现行后，大模型拒不认账。未来某天，AI会不会真要失控？

来自主题: AI技术研报

7874 点击 2024-11-29 14:52

在过去几年中，人工智能（AI）技术的发展一日千里，展现出令人惊叹的能力。从击败人类顶尖棋手，到生成逼真的人脸图像和语音，再到如今以ChatGPT为代表的一众聊天机器人，AI系统已经逐渐渗透到我们生活的方方面面。

来自主题: AI资讯

11612 点击 2024-05-23 09:43

AI教父Hinton的担心，不是没有道理。

来自主题: AI技术研报

6902 点击 2024-05-14 10:45