快感与危机并存的AI解药
国庆至今,一场由AI主导的"雷军模仿秀"已经上演。
假期间,视频平台有不少“雷军骂人”的配音视频出现。这些视频配音一般都是三步走:开头开门见山,“大家好,我是雷军”;中间锐评堵车、假期、调休、游戏等热门话题;结尾虎狼之词,“我远程遥控小米su7创死xx”,与往日温文尔雅的雷总的言行大相径庭。
“被雷军骂了7天”登上热搜,事实上,这些视频中雷军的声音并非出自雷军本人,细细听下去会发现这些内容其实都是AI合成的。
这些视频中的雷军是AI生成的声音,搭配视频上本人和蔼的笑容,强烈的反差刺激着年轻人们迷失在这场娱乐狂欢之中。大家纷纷借助“AI雷军”发表对一些事情的看法。
抖音上“AI雷军”话题浏览量过亿,B站上相关创作超过上百条。而目前,由于配音音频可能会造成侵权的问题,相关平台已经开始监管,就抖音平台来说,两天时间已经下架了绝大部分相关内容。
虽然如此,但这股突如其来的AI雷军热潮却不是空穴来风。前有AI孙燕姿唱歌,后有AI陈建斌配音,新技术的出现建立了与人们之间复杂而微妙的互动关系,AI也在这之中悄然挑动着人们的神经。
“发疯”成为当代年轻人的普遍现象。
开年凭借抽象派文学——“黄龙江一派都带蓝牙”,年轻人在“选择yes or no”中选择“or”,已读乱回应付过年串亲戚的尴尬局面中,主打不攻击别人,也不内耗自己。年后更是以“抽象派”穿搭,表达大家对上班的不满,在整活中宣泄情绪。
图源:小红书
图源:@Kendou S-
随着AI配音技术不断迭代,这次年轻人盯上了AI雷军。
“现实中的雷军唯唯诺诺,AI里的军子重拳出击。”AI雷军一改之前真人雷总文质彬彬的形象,化身“网络喷子”,替年轻人表达了许多话。
打游戏不顺心时,国庆堵车时,假期结束时,网友:AI雷军。打开视频网站,清一色标题“雷军锐评”,带上ai雷军的tag,视频0帧起手,直抒胸臆,一口一个老子、畜生,一阵鸟语花香过后,以“远程遥控小米su7创死xx”、“远程遥控小米手机死机自爆”等威胁结束。AI雷军语气温和但脏话不断,与本人形成强烈的反差。
也有网友怕侵权,提前用AI杜撰了小米对此事回应,表示“我们不会追究”。这些视频伪装得和真的一样,开始AI雷军的表现足以以假乱真:澄清事实,夸网友们才华,最后还不忘提醒网友们注意甄别,小米法务部会找到始作俑者。后面画风一转,“雷军”表示不会起诉用AI恶搞的人,因为“我要直接远程操控他的小米手机死机,然后爆炸”。弹幕至此飘满“懂了”,许多网友已心领神会。
“00后运营”紧跟潮流,许多官方文旅开始用雷军的声音来宣传家乡,邀请广大网友来家乡游玩。但此前浙江文旅就引用来AI雷军宣传,几日便获赞1.2w,现可能因侵权纠纷已删除。
温文尔雅的上市公司总裁竟也能口吐芬芳,换一种维度来说,AI帮助年轻人实现了许多幻想。在强烈反差的刺激中,年轻人爱上了和AI雷军一起发癫。
不得不说,吐出这些“恶狠狠”的话确实别是一番风味,令人忍俊不禁,这种反差更会激发网友们的兴趣和好奇心。但玩梗归玩梗,这些视频开头言之凿凿“我是雷军”、“雷军锐评”,配图用真人照片,在侵权的边缘疯狂试探。
在现实生活中,人们往往会受到各种社会规范和道德约束。但在AI的世界里,这些界限变得模糊。那些看似在发癫的年轻人,其实是在寻求一种情绪的出口。
正如古话,“鱼塘中存在大型鱼类,周围环境中也必定存在能够捕食这些大鱼的生物”一样,现象的扎堆也往往暗示着技术的普及或是传播的泛滥。显然,AI雷军的出现前者作用更大。
去年AI孙燕姿爆火,那时要想训练出一个可行的AI声纹不仅需要一个配置较高的显卡,还需要完成切割音频、租云算力、上传数据集、在So-VITS-SVC上训练等等繁杂且门槛较高的步骤,才能得到一个声音的参数模型。
而现在,实现AI声纹的提取和应用已经很简单了。在社交平台检索“AI配音”会发现,现在市面上已经能轻松实现声音克隆,尤其是名人的声音。AI配音在小红书有超千万次的浏览,在抖音检索AI配音也会直接推荐可以进行配音的小程序。
一般用户想用名人的声音,许多小程序经过简单的检索就可以直接实现语音生成。据了解,如配音兔小程序中也有雷军的AI声纹,但因权限问题,被改名成“雷老板”,但也未能逃避公关团队的法眼,目前已下架。而许多配音软件,如Reecho睿声,则是直接标注“雷军”,并在主页进行推荐。
在这些近乎免费的声音市场中,许多人的声音被当成物品,用户可以随意挑选,并“放入购物车”,截至目前AI鲸选社看到的有刘亦菲、蔡徐坤、丁真等。
这些配音软件的使用方法也及其简单,完成登陆后只需要三步:点击进入你所想要的名人声纹界面,直接输入你想要生成的文字,生成mp3文件,并且还可以无门槛下载。
目前图中展示的这些配音软件能将雷军的声音还原70%左右,不仅如此,其生成的语音还会根据文本附加上一些情绪和气口,若不细听,足以以假乱真。
此次生产AI雷军音频的主力,“睿声”(也就是言域科技)在国庆假前就“小有名气”。言域科技是9月底三只羊“录音门”伪造音频背后的涉事公司。该公司此前也公开声明称,三只羊事件使用的是“Reecho睿声”大模型,由卢文庆30秒的直播片段克隆生成。
据AI前哨战报道,针对“雷军”的AI配音,言域科技也认领了“罪名”,表示只是创作工具提供方,但没有足够的力量控制事态的演变,“对此也感到比较遗憾”。
AI雷军爆火后,言域科技表示,正在配合小米予以处理。但AI鲸选社发现,事发多天后,雷军的克隆声纹仍在“睿声”声音市场的首页,占据多个推荐位。
技术更易操作使AI配音走入大众的视野,正值国庆假期,人们的情绪需要出口,这时和蔼可亲的雷布斯跃然“推荐页”,成为了年轻人这波数字狂欢的“众矢之的”。
AI雷军的爆火,是其带来的新鲜感冲击着大众。
在鲸妹试用AI配音软件生成的音频时,也被AI雷军“锤死你胸口”的猎奇感所吸引,情不自禁地陷入了“那这个声音说出这句话会是什么样”的圈套之中,留恋了一小时有余。
年轻人也被这种AI技术带来的新奇感吸引,其中的第一步是,AI往往能实现许多人们现实中无法完成的事。如AI雷军能说出一系列真人雷军不可能说出的话,AI孙燕姿能唱周杰伦的歌,再如之前爆火的粘土风AI塑造的“小羊肖恩的世界”。
“超现实体验”刺激着年轻人们的精神末梢,给年轻人带来一种突破圈层的快感。AI配音网页的推荐页也会不断刺激观众的这种“超现实体验”,让年轻人们不断沉浸在这种新奇的体验中。
而这些AI技术的出圈往往伴随着“天时地利人和”的病毒式的传播。我们回看,粘土风爆火是正值五一假期,用户社交需求旺盛,而创新Al技术+免费试用的低准入门槛也是占据“地利”和“人和”。再看此次AI配音,也是一样的公式,只是换乘了十一假期的东风。
这其中不同的是,这次AI侵犯了具体人名的一系列权益。尤其雷军虽然喜欢顽梗,但很多AI已经罔顾事实,比如雷军那句“友商是S B”,其实后面还有一句小米更傻,其实是句自嘲。但AI雷军用这句四处攻击别人。
于是在最近,有人在雷军的微博下评论:“雷总,你最近怎么总在骂人?”,雷军对此回复了三个“愤怒”的表情。隔天小米公关总经理王化便表示已经将AI骂人交给法务部处理。
假后第一天,小米法务部直奔一线,对AI雷军骂人视频进行了处理。截至发稿,抖音平台上关于AI雷军配音的骂人视频均已下架(无论标没标AI生成),取而代之的则是各大自媒体帮发的辟谣视频,在B站上零星还可以检索到一些“雷军锐评”的痕迹。
AI雷军配音只是AI时代数字狂欢的一个缩影,现象背后则是AI配音找到了C端应用的一个爆款。年轻人需要新的表达方式,正如此前爆火的粘土风AI,在用户生活和娱乐两个场景中取了个交集,用户可以将自己的生活粘土化,达到娱乐的目的。粘土风AI将图像处理以一种有趣的形式带入到了大众的视野中。
而这次的AI配音也同样是结合了用户生活和娱乐双方面的需求,但因玩梗有些过火,顶着“雷军”的名号骂人。但目前,抖音平台上也有一些用雷军声纹配祝福语的视频流传,评论区“喜极而泣”:终于不用挨骂了。
在社交媒体内容的四种形式:图、文、声、视频中,AI在图和声中碰撞出了爆款,我们不禁期待,视频处理技术普及后会带来的下一个爆款,但同时也恐惧着。
技术的普及往往也是双刃剑,人们普惠地享受到技术带来的“快感”的同时,也将承受技术泛滥带来的危害。三只羊录音伪造者仅用了30秒的直播录音就可以伪造出大多数人都信以为真的录音片段。国外的Deep-Live-Cam换脸技术也仅仅使用了马斯克在社交平台的照片就实现了实时换脸直播。
年轻人顽梗发癫,形成的潮流会随着时间兴起到消失,但对于普通人来说,多接几通陌生电话、多传几张照片,就可能面临声音、面容信息被AI提取的风险,损失则是不可挽回的。
AI带来的有便捷,也有对世界的新奇体验,但水面之下也存危机。而普通人能做的只有把网络世界归还“虚拟”,时刻保持警觉。
文章来自于微信公众号“AI鲸选社”,作者“陈佳惠”
【开源免费】MockingBird是一个5秒钟即可克隆你的声音的AI项目。
项目地址:https://github.com/babysor/MockingBird
【开源免费】Deep-Live-Cam是一个只需一张图片即可实现实时换脸和一键视频深度伪造的AI项目。
项目地址:https://github.com/hacksider/Deep-Live-Cam
【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。
项目地址:https://github.com/Henry-23/VideoChat
在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat
【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址:https://github.com/PeterH0323/Streamer-Sales