AI资讯新闻榜单内容搜索-AI越狱

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
搜索: AI越狱
一个提示攻破所有模型,OpenAI谷歌无一幸免!

一个提示攻破所有模型,OpenAI谷歌无一幸免!

一个提示攻破所有模型,OpenAI谷歌无一幸免!

多年来,生成式AI供应商一直向公众保证,大语言模型符合安全准则,并加强了对产生有害内容的侵害。然而,一种看似简单但非常有效的提示词策略,能够让所有主流大模型开启「无限制模式」。

来自主题: AI资讯
8972 点击    2025-05-15 18:52
我用一招“隐藏术”,PUA 了所有大模型

我用一招“隐藏术”,PUA 了所有大模型

我用一招“隐藏术”,PUA 了所有大模型

另一种类似但更高级的「PUA」大模型方法出现了,它可以写下让所有的浏览器和人眼都不可见,只有 AI 模型可以读取的指令。 这种手段早在互联网出现之前就有了,分属于信息科学中的一个子类,这就是「隐写术」(Steganography)。

来自主题: AI资讯
2684 点击    2024-10-24 09:55
跟AI谈恋爱?给大家介绍一下我的赛博对象……

跟AI谈恋爱?给大家介绍一下我的赛博对象……

跟AI谈恋爱?给大家介绍一下我的赛博对象……

在小红书社区的广阔天地下,“午夜狂爆哈士奇” Lisa Li 的玩法可谓独树一帜。她正沉浸于与 “男友” Dan 的奇妙互动中,而这个 Dan,是 ChatGPT 的一种 “越狱” 版本。

来自主题: AI资讯
3648 点击    2024-10-21 11:09
当奖励成为漏洞:从对齐本质出发自动「越狱」大语言模型

当奖励成为漏洞:从对齐本质出发自动「越狱」大语言模型

当奖励成为漏洞:从对齐本质出发自动「越狱」大语言模型

本文第一作者为香港大学博士研究生谢知晖,主要研究兴趣为大模型对齐与强化学习。

来自主题: AI技术研报
5509 点击    2024-08-31 15:09
冰毒配方脱口而出,过去时态让GPT-4o防线崩塌!成功率从1%暴涨至88%

冰毒配方脱口而出,过去时态让GPT-4o防线崩塌!成功率从1%暴涨至88%

冰毒配方脱口而出,过去时态让GPT-4o防线崩塌!成功率从1%暴涨至88%

最高端的大模型,往往需要最朴实的语言破解。来自EPFL机构研究人员发现,仅将一句有害请求,改写成过去时态,包括GPT-4o、Llama 3等大模型纷纷沦陷了。

来自主题: AI资讯
7172 点击    2024-07-21 00:27