AI变得越来越聪明后,要让用户证明自己不是机器人已不现实。
互联网上哪些是真、哪些是假,几乎是一个永远不会有答案的问题,因此在上网冲浪时去伪存真,可以说是当下网民的必备技能。只可惜随着技术的快速进步,互联网世界的一切似乎都变得真假难辨了,特别是在生成式人工智能(AIGC)逐步成熟之后。最近一段时间,马斯克化身“超市大盗”的视频在海外被大量传播,其实就是海外用户使用Grok AI和最新的文生图模型FLUX生产的恶搞内容。
甚至在借助AI技术恶搞名人背后,是AI已然成为了网络黑灰产的得力助手。例如一家英国跨国企业的香港分公司被AI换脸和AI音频冒充的总公司CFO骗走2亿港币、“AI马斯克”骗走老人退休金、“Yahoo Boys”使用AI生成的视频进行网恋骗局等,类似被曝光的“AI作恶”案例更是数不胜数。眼见AI技术被滥用,OpenAI等大厂和相关科研人员就坐不住了。
日前来自麻省理工学院、加州大学伯克利分校、OpenAI、微软等25家机构的科学家,在探讨AI带来的网络安全挑战中所可能面临的困难与前景时,联手提出了一个打击AI造假的新手段——“人格凭证”(Personhood Credentials, PHC)。作为一项全新的数字身份认证技术,PHC的核心是证明用户是人类,这与当下主流的验证码(CAPTCHA)正好相反,后者的核心是要求用户证明“我不是机器人”。
“CAPTCHA”(全自动公共图灵测试)作为一项在本世纪初诞生的技术,是为了对抗当时泛滥的垃圾邮件而生。彼时由于OCR等提取图像中文字信息的技术尚不成熟,开发者借助人类可以用肉眼识别出在图片中被扭曲过、污染过的文字信息,而电脑则缺乏这一能力的原理,开发了CAPTCHA技术。
只是随着计算机视觉技术在过去十年间的快速成熟,传统的、基于文字的验证码技术也被攻破,业界也在不断升级防御措施,以谷歌reCAPTCHA、BotDetect的CAPTCHA生成器为代表的这一代验证码技术也应运而生。比如ReCAPTCHA上显示的待验证内容,就是谷歌自家OCR也无法识别的内容构成。
当卷积神经网络(CNN)以及生成对抗网络(GAN)出现之后,神经网络算法很快就让图片验证码落伍了。这时候,国内的互联网厂商搞出了将验证码与常识结合的答题模式,让用户根据问题去在验证码中寻找正确的答案,比如12306上堪称反人类的验证码就是如此。再然后就是目前国内互联网产品中最常用的行为验证模式,即采集用户数据,并借助基于人类固有的生物特征,来判断访客是人还是机器。
但遗憾的是,AI大模型彻底终结了围绕验证码展开的攻防战。美国加州大学艾尔文分校的研究人员就发现,无论游戏式、点击式,还是扭曲文字式等不同类型的验证码,当下AI验证reCAPTCHA系统的准确度已经比人类还高,并且准确率几乎都在85%以上。要知道根据过去互联网厂商迭代验证码系统的惯例,如果机器成功解答验证码的比率高于1%,那么这套验证码系统就是失败的。
如此一来,在AI加持下,传统的验证码系统可以说是失灵了。但验证码系统失效的后果是很可怕的,因为这就意味着互联网产品将无法通过自动化程序来批量判定哪些访问是来自人类、哪些是来自机器。如果机器冒充人类出现在平台上、只是为了充当内容农场的发帖机器人也就罢了,真正麻烦的是机器人与深度伪造技术的组合。
此前在2017年,一项名为deepfake(深度伪造)的技术在Reddit上出现,其利用生成式对抗网络(GAN)和深度学习算法实现了十分逼真可信的换脸视频。只是由于当时deepfake对于使用者的计算机知识有一定要求,所以即使后续被开源,也只是在某些小圈子里被频繁使用,而ChatGPT的横空出世则改变了深度伪造技术。
大语言模型以及随后诞生的多模态大模型,让文生音频、文生视频变成了现实,诸如可灵AI、Suno、Midjourney等琳琅满目的AI产品就已然实现了“无中生有”。比如美国知名歌手泰勒·斯威夫特就成为了了AI深度伪造的受害者,大量由AI生成的虚假照片、带货视频如今已经在X、Facebook泛滥成灾了。
机器人账号配合AI大模型加持的深度伪造技术来批量生产虚假信息,这就是当下互联网所面临的最严峻挑战。PHC就是在这一情况下被提出,该技术的基础是现实世界的验证,因为机器是虚拟的、而人类是真实的,且机器暂时还做不到“打破第四面墙”,从虚拟世界来到现实世界。
研究人员设想,政府或其他数字服务机构可以为每位用户发放一个唯一的身份凭证,待到现实世界的身份验证完成后,PHC将生成一个加密的数字凭证,并将其以数字形式存储在用户的个人设备上。为了避免用户的PHC在与不同互联网产品交互时出现泄露,研究人员还巧妙地引入了“零知识证明”(Zero-Knowledge Proof)。
通过零知识证明,一方能在不提供任何必要信息的情况下向另一方证明某件事,从而达到保护隐私的效果。即在不透露密码的前提下,验证方通过一系列问题来让对方提供 “我知道正确密码”的信息。
归根结底,在AI变得越来越聪明的情况下,要让用户证明自己不是机器人已经不现实了。按照之前OpenAI CTO Murati在接受采访时的说法,GPT-3的智能已经相当于幼儿,GPT-4则相当于聪明的高中生,而下一代模型(GPT-5)或将达到博士的水平。所以在不远的未来,AI在智能水平上超越一般人已经是板上钉钉的事情。
类似做题、分辨图片类型的解决方案已经或即将对AI失效,这时候寻找人类拥有、而机器没有的信息,也就成为了未来分辨机器和人类的关键。毕竟对于AI厂商和互联网巨头而言,服务机器人是毫无意义的,因为只有人类用户才能贡献真正的价值。
文章来自于微信公众号“三易生活”,作者“三易菌”