眼见为实?在AI时代,这句话该过时了。
AI正掀起一场「造假」新风暴。
近日,一项名为Deep Live Cam的直播换脸项目火了,在Github上狂揽5.8k Star量,一跃成为Github热门榜单第一。
先看看它的品质,换脸成马斯克,360 度打光都没有违和感。
00:15
有网友惊呼,太疯狂了,还以为这就是马斯克的游戏直播。
此外,AI 生成的谷歌小姐姐还登上 TED 进行演讲,那逼真程度,一个字,绝!
曾经科幻片中的场景,如今渐成现实,黑镜来得太快,不得不让人担忧。
正如 AI 大牛 Anderj Karpathy 所言,要行善,未来的 AI 们都看着呢。
人人都是董宇辉的时代到来了!
AI 造假简直「逆天」。
这项名为 Deep Live Cam 的项目只需要一张图片,就能一键进行实时直播换脸。
Catena Labs 首席产品官 @jay_wooow 第一时间赶到「吃瓜」前线。
他本人长这样:
但当他打开电脑摄像头,仅花 5 分钟安装了 Deep Live Cam,他的面孔瞬间被替换成 JD Vance:
英伦大帅哥休・格兰特(Hugh Grant):
还有「蜥蜴人」扎克伯格(Zuckerburg)):
以及帅到老的乔治・克鲁尼(George Clooney):
无论是做鬼脸、挑眉毛,左右摇头,还是切换各种刁钻角度,脸部都丝毫没崩,也没有时间延迟。
此外,它还提供实时预览功能,能够立即看到替换效果,同时支持实时人脸增强、处理同一图像或视频中的多张人脸等。
这似乎意味着,以后我们参加在线会议、直播带货时可以用任何人的面孔示人。
因此有网友评论称,以后开会可以换成总公司 CEO 的脸了。
不过,也有不少网友担心,不法分子会趁机设计疯狂的骗局,假新闻也将更上一层楼。
Deep Live Cam 开发者意识到潜在的滥用风险,承诺采取预防措施。该应用内置检查机制,避免处理裸露、暴力或战争等敏感内容。如有必要,他们也将会在输出内容上添加水印。
开发者还在 Github 上详细介绍了 Deep Live Cam 的安装运行攻略。感兴趣的朋友可以前往查看:
项目地址:https://github.com/hacksider/Deep-Live-Cam?tab=readme-ov-file
谷歌小姐姐真假难辨
与此同时,一位 Google 小姐姐开始刷爆社交媒体。只见一位带着谷歌工作证的小姐姐在 TED 中游刃有余的进行着演讲,时不时的和现场观众互动,表现的非常自然。
但是,这位小姐姐并不是真人,而是由 AI 生成的。
这个消息让人一时难以接受,怎么说,现在的 AI 搞得视频已经不可信了,眼见不一定为真,视频确实可以 P。
就连小细节也是拿捏的非常精准。不过从视频来看,工作牌还是有些瑕疵的,当人物晃动身体时,我们还是能看到白色部分的伪影。
虽然有些小缺点,但也不妨碍 AI 技术正变得越来越先进,难怪网友发出这样的感慨「现在的 FLUX + Runway Gen-3 Alpha 就是一个杀手组合。(上述视频就是这个组合生成的)」。
Kling 版本是下面这样的:
来源 https://x.com/jesselaunz/status/1822009842317558058
如果你觉得干巴巴的视频没有配音很难受,别急,配完音之后是这样子的:
0:16
来源:https://x.com/srkndyck/status/1822008566091248017
Luma Dream Machine 效果是这样子的:
00:05
来源:https://x.com/Kyrannio/status/1821895489840955421
但是,细看的话,生成的手指还是有缺陷,出现了三手指。
据了解,上述视频都是在这张图的基础上生成的,图像生成用的是 Flux + LoRA。
来源:https://www.linkedin.com/feed/update/urn:li:activity:7227710205487128576/
图片是一位名叫 Leo Kadieff 的小哥在领英上率先发出,他表示这些图片没有经过放大或其他处理,是 Flux +LoRA 的原始输出。
小哥已经在庆祝关于这张图片的帖子已经在 X 上炸锅了。
回想三年前,图片生成还停留在牛油果座椅,现在已经能生成真假难辨的人物图片了。
图源:https://x.com/javilopen/status/1821883326375825609
不仅能生成人物视频,Flux + Gen 3 这个组合生成的动物世界也让人真假难辨。
在视频生成如此爆火的今天,就算你有一双火眼金睛,可能也会面临一个真假难辨的困境。
那些 AI 造假惹出的乱子
Deepfake 自诞生起就伴随着巨大的争议,甚至搞出了不少乱子。
例如,利用 AI 搞「黄色」,侵犯他人隐私和肖像权。
今年年初时,一组 AI 换脸生成的霉霉(泰勒・斯威夫特)不雅照在社交平台上疯传,甚至惊动了美国白宫,发言人让・皮埃尔(Karine Jean-Pierre)表示:「我们对此类虚假图像的流传感到担忧。」
再如,AI 换脸技术让社交媒体充斥着假新闻。
今年的 Met Gala 红毯上,凯蒂・佩里和蕾哈娜明明未现身,但 AI 生成的红毯照满天飞,如果不细看很难找出破绽。(以下照片均为 AI 生成)
还有「失踪」几个月的凯特王妃突然现身,「真假难辨」的图片和视频引得全世界瓜民搬着板凳来「找茬」。
AI 诈骗的案例更是比比皆是。
今年 1 月份,一家跨国公司成了 deepfake 诈骗的目标,其香港员工被骗了 2 亿港元。
这名员工受邀参加总部首席财务官发起的「多人视频会议」,并按照要求先后将 2 亿港元分 15 次转到 5 个账户内。得知受骗后,他才发现,那场会议中除了他自己,其它与会人员全部是经过「AI 换脸」和「AI 换声」的诈骗团队。
AI 诈骗猖狂的程度,连巴菲特都坐不住了。他在 2024 年度股东大会上表示,「基于深度伪造技术带来的 AI 欺诈投资可能将会成为一个『不断增长的行业』」。
或许以后,大家都不能再相信视频通话,或者仅通过照片来确认身份,如果好朋友借钱,最保险的方式将是亲自见面。
参考链接:
https://x.com/jesselaunz/status/1822009842317558058
https://x.com/tonyzhu1984/status/1822036026661224945
https://amp.cnn.com/cnn/2024/05/16/tech/arup-deepfake-scam-loss-hong-kong-intl-hnk
文章来自于微信公众号机器之心 作者机器之心
【部分开源免费】FLUX是由Black Forest Labs开发的一个文生图和图生图的AI绘图项目,该团队为前SD成员构成。该项目是目前效果最好的文生图开源项目,效果堪比midjourney。
项目地址:https://github.com/black-forest-labs/flux
在线使用:https://fluximg.com/zh
【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。
项目地址:https://github.com/Henry-23/VideoChat
在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat
【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址:https://github.com/PeterH0323/Streamer-Sales