# 热门搜索 #
搜索
情侣合照逼真到恐怖,竟被代码识出破绽?沃顿教授预言AI 18个月封神
6662点击    2024-08-12 18:32

AI生图工具Flux,俨然已经掀起了全网的风暴。这张情侣写真逼真、细腻,打光、纹理、毛发,都是挑不出破绽的程度。视频、声音、口型,AI的进化越来越完美了!


最近Flux的爆火,简直把所有人的三观都撼动了。 


不懂就问:现在网上的东西,还有什么是真的? 


01 Flux震惊全网


如今,开源文生图模型Flux,俨然已经在全网掀起了一股风暴。 


下面这些合影,竟然全是AI生成的?简直把这位博主震惊到怀疑人生。 



正面特写大光圈,脸部打光、肌肉纹理、毛发,看不出丝毫破绽。 



注意,即使是背景板人物们,也很自然,挑不出太大毛病。 



镜头远一点,光线暗一点呢?也很自然。 



两个人物在光线明暗处的对比,简直搞出了世界名画的光影质感。 



就问细不细腻,真不真实吧? 



人再多一点,Flux也没在怕的。 


无论是三个人、四个人、五个人,乃至更多人,画面依然挑不出错。 







挑刺的网友们,还在努力寻找着细小的bug。 


最容易一眼看破是AI的,无疑就是徽标上的文字了。 



感受到了AI想蒙混过关的努力 


还有一些细节,比如AI不懂人类的帽子和项链是干嘛使的,所以画出来还是会有漏洞。





顺便,一年半前Midjourney V5经验全网的情侣合照长这样:



01 一大波二创来袭


现在,全网已经掀起了Flux生图的风暴,人们一致感叹:Flux把AI生图带到了新的一级台阶。 





每当我们觉得AI生图不可能变得更好时,它都会再次证明:我们错了。 





用这位博主的话来说就是,AI正在失控,潘多拉魔盒正在被打开! 



尤其是Flux如此高超的生图能力和开源可玩性,也给各种二创、视频、语音的创作提供了极大的空间。 



这些被疯转的TEDx演讲者,就不必说了。 






这位网友用Flux、可灵AI和synclabs,做出一段YouTube网红博主的视频。


虽然仍有AI的痕迹,但图像和视频上的进步已属惊人。


作者表示,自己的目的并不只是创建网红,而是制作自动化广告、YouTube、TikTok视频、教学视频、营销、讲解课程等等。


甚至当AI达到足够快时,它就能达到实时生成,FaceTime AI朋友或者AI治疗师都有望成真。 



是的,要说AI有什么最恐怖,那就是它的速度了。 


渲染一段AI短片,时间只需要几秒、几分钟。毫无疑问,AI正在走向世界,所有人对此都很乐观。 





这位博主结合了Flux和LoRA,发现LoRA对现实主义图像和绘画/艺术图像,也都有很好的处理效果。 




Flux.1和LoRA,对动漫生成效果也很好,单个4090就可跑。 





这位网友表示,自己用了不到1个小时,就做出了两个香水广告。他直言:我们已经接近AI视频的奇点。 




02 AI超进化,只用18个月


沃顿商学院AI方向的副教授看到了最近的AI生成视频后,做出预言——AI将在18个月之后完成进化。 



之所以有这种观点,是因为AI模型的进化速度实在超乎想象。 


比如下面这几张「水獭在飞机上使用wifi」的图片,在一两周的时间内就有肉眼可见的进步。 



再看看一年多之后,现在的AI进化成什么样子了—— 



仅水獭的形象更加逼真可爱,操作手机时的手部动作也没有破绽。 


再来对比一下同款产品的进化速度:MidJourney v3和v4之间就有非常明显的进步。




03 一秒换脸马斯克,口型同步不露馅


不仅如此,最近GitHub一项爆火研究称,只需一张照片,就能换脸直播.


下面的视频中,只见马斯克「本尊」戴上眼镜,开启了实时无延迟直播。 


是连马斯克的妈都要骗过的程度。 



还有LeCun大佬,也被网友拿来换脸直播。 



目前,项目已经在GitHub上收获了14k星,刷榜Trending。 


与此同时,各种对口型技术,比如ReSyncer,也让AI视频人物的嘴型无比自然。




至此,AI把一整个工作流都跑通了!从此在网上看到再逼真的影像,我们心里恐怕都要打个问号了。 


04 提高饱和度,AI生图露怯


所以,究竟有没有什么方法,能用火眼金睛识别出AI的痕迹? 


蹭着最近这波AI生图热度,前谷歌搜索创始人之一Deedy提出—— 


识别AI图片最好的方法,就是提高图像饱和度,并仔细查看麦克风接口、牙齿的部位。 



就比如,最近爆火的TED演讲者的图片,将饱和度设为200%,可以看到让人惊悚的牙齿。 





值得一提的是,识别工具的代码均是由Claude编写的,而且还是公开可用。 



不过,再拿另一张AI生成的TED演讲者图片进行测试,却毫无破绽。 


这张图片中,牙齿并不奇怪,而且在正题颜色区域色彩更加一致。 


Deedy称,如果对真实图像进行JPG压缩,可能会破坏这种一致性。


05 网友:只能拔网线了


当我们身处一个被AI包围的「楚门的世界」,人类最后的退路在哪里? 


也许,是时候拔掉网线了。 



参考资料: 


https://x.com/AngryTomtweets/status/1822203767728591350 

https://x.com/deedydas/status/1822665923775611374

https://github.com/hacksider/Deep-Live-Cam?continueFlag=4be7aad2ca0a560d6f9019228a8b2d3e

https://x.com/emollick/status/1822774265390985401

https://www.reddit.com/r/singularity/comments/1eo4sne/single_image_to_live_stream_deep_fake_deeplivecam/


本文来自微信公众号“新智元”,作者:新智元




关键词: AI , AI照片 , Flux , AI文生图
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI工作流

【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费)


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/(付费)

2
Flux

【部分开源免费】FLUX是由Black Forest Labs开发的一个文生图和图生图的AI绘图项目,该团队为前SD成员构成。该项目是目前效果最好的文生图开源项目,效果堪比midjourney。

项目地址:https://github.com/black-forest-labs/flux

在线使用:https://fluximg.com/zh

3
无人直播

【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。

项目地址:https://github.com/PeterH0323/Streamer-Sales