AI生图工具Flux,俨然已经掀起了全网的风暴。这张情侣写真逼真、细腻,打光、纹理、毛发,都是挑不出破绽的程度。视频、声音、口型,AI的进化越来越完美了!
最近Flux的爆火,简直把所有人的三观都撼动了。
不懂就问:现在网上的东西,还有什么是真的?
如今,开源文生图模型Flux,俨然已经在全网掀起了一股风暴。
下面这些合影,竟然全是AI生成的?简直把这位博主震惊到怀疑人生。
正面特写大光圈,脸部打光、肌肉纹理、毛发,看不出丝毫破绽。
注意,即使是背景板人物们,也很自然,挑不出太大毛病。
镜头远一点,光线暗一点呢?也很自然。
两个人物在光线明暗处的对比,简直搞出了世界名画的光影质感。
就问细不细腻,真不真实吧?
人再多一点,Flux也没在怕的。
无论是三个人、四个人、五个人,乃至更多人,画面依然挑不出错。
挑刺的网友们,还在努力寻找着细小的bug。
最容易一眼看破是AI的,无疑就是徽标上的文字了。
感受到了AI想蒙混过关的努力
还有一些细节,比如AI不懂人类的帽子和项链是干嘛使的,所以画出来还是会有漏洞。
顺便,一年半前Midjourney V5经验全网的情侣合照长这样:
现在,全网已经掀起了Flux生图的风暴,人们一致感叹:Flux把AI生图带到了新的一级台阶。
每当我们觉得AI生图不可能变得更好时,它都会再次证明:我们错了。
用这位博主的话来说就是,AI正在失控,潘多拉魔盒正在被打开!
尤其是Flux如此高超的生图能力和开源可玩性,也给各种二创、视频、语音的创作提供了极大的空间。
这些被疯转的TEDx演讲者,就不必说了。
这位网友用Flux、可灵AI和synclabs,做出一段YouTube网红博主的视频。
虽然仍有AI的痕迹,但图像和视频上的进步已属惊人。
作者表示,自己的目的并不只是创建网红,而是制作自动化广告、YouTube、TikTok视频、教学视频、营销、讲解课程等等。
甚至当AI达到足够快时,它就能达到实时生成,FaceTime AI朋友或者AI治疗师都有望成真。
是的,要说AI有什么最恐怖,那就是它的速度了。
渲染一段AI短片,时间只需要几秒、几分钟。毫无疑问,AI正在走向世界,所有人对此都很乐观。
这位博主结合了Flux和LoRA,发现LoRA对现实主义图像和绘画/艺术图像,也都有很好的处理效果。
Flux.1和LoRA,对动漫生成效果也很好,单个4090就可跑。
这位网友表示,自己用了不到1个小时,就做出了两个香水广告。他直言:我们已经接近AI视频的奇点。
沃顿商学院AI方向的副教授看到了最近的AI生成视频后,做出预言——AI将在18个月之后完成进化。
之所以有这种观点,是因为AI模型的进化速度实在超乎想象。
比如下面这几张「水獭在飞机上使用wifi」的图片,在一两周的时间内就有肉眼可见的进步。
再看看一年多之后,现在的AI进化成什么样子了——
仅水獭的形象更加逼真可爱,操作手机时的手部动作也没有破绽。
再来对比一下同款产品的进化速度:MidJourney v3和v4之间就有非常明显的进步。
不仅如此,最近GitHub一项爆火研究称,只需一张照片,就能换脸直播.
下面的视频中,只见马斯克「本尊」戴上眼镜,开启了实时无延迟直播。
是连马斯克的妈都要骗过的程度。
还有LeCun大佬,也被网友拿来换脸直播。
目前,项目已经在GitHub上收获了14k星,刷榜Trending。
与此同时,各种对口型技术,比如ReSyncer,也让AI视频人物的嘴型无比自然。
至此,AI把一整个工作流都跑通了!从此在网上看到再逼真的影像,我们心里恐怕都要打个问号了。
所以,究竟有没有什么方法,能用火眼金睛识别出AI的痕迹?
蹭着最近这波AI生图热度,前谷歌搜索创始人之一Deedy提出——
识别AI图片最好的方法,就是提高图像饱和度,并仔细查看麦克风接口、牙齿的部位。
就比如,最近爆火的TED演讲者的图片,将饱和度设为200%,可以看到让人惊悚的牙齿。
值得一提的是,识别工具的代码均是由Claude编写的,而且还是公开可用。
不过,再拿另一张AI生成的TED演讲者图片进行测试,却毫无破绽。
这张图片中,牙齿并不奇怪,而且在正题颜色区域色彩更加一致。
Deedy称,如果对真实图像进行JPG压缩,可能会破坏这种一致性。
当我们身处一个被AI包围的「楚门的世界」,人类最后的退路在哪里?
也许,是时候拔掉网线了。
参考资料:
https://x.com/AngryTomtweets/status/1822203767728591350
https://x.com/deedydas/status/1822665923775611374
https://github.com/hacksider/Deep-Live-Cam?continueFlag=4be7aad2ca0a560d6f9019228a8b2d3e
https://x.com/emollick/status/1822774265390985401
https://www.reddit.com/r/singularity/comments/1eo4sne/single_image_to_live_stream_deep_fake_deeplivecam/
本文来自微信公众号“新智元”,作者:新智元
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【部分开源免费】FLUX是由Black Forest Labs开发的一个文生图和图生图的AI绘图项目,该团队为前SD成员构成。该项目是目前效果最好的文生图开源项目,效果堪比midjourney。
项目地址:https://github.com/black-forest-labs/flux
在线使用:https://fluximg.com/zh
【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。
项目地址:https://github.com/Henry-23/VideoChat
在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat
【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址:https://github.com/PeterH0323/Streamer-Sales