ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
情侣合照逼真到恐怖,竟被代码识出破绽?沃顿教授预言AI 18个月封神
6836点击    2024-08-12 18:32

AI生图工具Flux,俨然已经掀起了全网的风暴。这张情侣写真逼真、细腻,打光、纹理、毛发,都是挑不出破绽的程度。视频、声音、口型,AI的进化越来越完美了!


最近Flux的爆火,简直把所有人的三观都撼动了。 


不懂就问:现在网上的东西,还有什么是真的? 


01 Flux震惊全网


如今,开源文生图模型Flux,俨然已经在全网掀起了一股风暴。 


下面这些合影,竟然全是AI生成的?简直把这位博主震惊到怀疑人生。 



正面特写大光圈,脸部打光、肌肉纹理、毛发,看不出丝毫破绽。 



注意,即使是背景板人物们,也很自然,挑不出太大毛病。 



镜头远一点,光线暗一点呢?也很自然。 



两个人物在光线明暗处的对比,简直搞出了世界名画的光影质感。 



就问细不细腻,真不真实吧? 



人再多一点,Flux也没在怕的。 


无论是三个人、四个人、五个人,乃至更多人,画面依然挑不出错。 







挑刺的网友们,还在努力寻找着细小的bug。 


最容易一眼看破是AI的,无疑就是徽标上的文字了。 



感受到了AI想蒙混过关的努力 


还有一些细节,比如AI不懂人类的帽子和项链是干嘛使的,所以画出来还是会有漏洞。





顺便,一年半前Midjourney V5经验全网的情侣合照长这样:



01 一大波二创来袭


现在,全网已经掀起了Flux生图的风暴,人们一致感叹:Flux把AI生图带到了新的一级台阶。 





每当我们觉得AI生图不可能变得更好时,它都会再次证明:我们错了。 





用这位博主的话来说就是,AI正在失控,潘多拉魔盒正在被打开! 



尤其是Flux如此高超的生图能力和开源可玩性,也给各种二创、视频、语音的创作提供了极大的空间。 



这些被疯转的TEDx演讲者,就不必说了。 






这位网友用Flux、可灵AI和synclabs,做出一段YouTube网红博主的视频。


虽然仍有AI的痕迹,但图像和视频上的进步已属惊人。


作者表示,自己的目的并不只是创建网红,而是制作自动化广告、YouTube、TikTok视频、教学视频、营销、讲解课程等等。


甚至当AI达到足够快时,它就能达到实时生成,FaceTime AI朋友或者AI治疗师都有望成真。 



是的,要说AI有什么最恐怖,那就是它的速度了。 


渲染一段AI短片,时间只需要几秒、几分钟。毫无疑问,AI正在走向世界,所有人对此都很乐观。 





这位博主结合了Flux和LoRA,发现LoRA对现实主义图像和绘画/艺术图像,也都有很好的处理效果。 




Flux.1和LoRA,对动漫生成效果也很好,单个4090就可跑。 





这位网友表示,自己用了不到1个小时,就做出了两个香水广告。他直言:我们已经接近AI视频的奇点。 




02 AI超进化,只用18个月


沃顿商学院AI方向的副教授看到了最近的AI生成视频后,做出预言——AI将在18个月之后完成进化。 



之所以有这种观点,是因为AI模型的进化速度实在超乎想象。 


比如下面这几张「水獭在飞机上使用wifi」的图片,在一两周的时间内就有肉眼可见的进步。 



再看看一年多之后,现在的AI进化成什么样子了—— 



仅水獭的形象更加逼真可爱,操作手机时的手部动作也没有破绽。 


再来对比一下同款产品的进化速度:MidJourney v3和v4之间就有非常明显的进步。




03 一秒换脸马斯克,口型同步不露馅


不仅如此,最近GitHub一项爆火研究称,只需一张照片,就能换脸直播.


下面的视频中,只见马斯克「本尊」戴上眼镜,开启了实时无延迟直播。 


是连马斯克的妈都要骗过的程度。 



还有LeCun大佬,也被网友拿来换脸直播。 



目前,项目已经在GitHub上收获了14k星,刷榜Trending。 


与此同时,各种对口型技术,比如ReSyncer,也让AI视频人物的嘴型无比自然。




至此,AI把一整个工作流都跑通了!从此在网上看到再逼真的影像,我们心里恐怕都要打个问号了。 


04 提高饱和度,AI生图露怯


所以,究竟有没有什么方法,能用火眼金睛识别出AI的痕迹? 


蹭着最近这波AI生图热度,前谷歌搜索创始人之一Deedy提出—— 


识别AI图片最好的方法,就是提高图像饱和度,并仔细查看麦克风接口、牙齿的部位。 



就比如,最近爆火的TED演讲者的图片,将饱和度设为200%,可以看到让人惊悚的牙齿。 





值得一提的是,识别工具的代码均是由Claude编写的,而且还是公开可用。 



不过,再拿另一张AI生成的TED演讲者图片进行测试,却毫无破绽。 


这张图片中,牙齿并不奇怪,而且在正题颜色区域色彩更加一致。 


Deedy称,如果对真实图像进行JPG压缩,可能会破坏这种一致性。


05 网友:只能拔网线了


当我们身处一个被AI包围的「楚门的世界」,人类最后的退路在哪里? 


也许,是时候拔掉网线了。 



参考资料: 


https://x.com/AngryTomtweets/status/1822203767728591350 

https://x.com/deedydas/status/1822665923775611374

https://github.com/hacksider/Deep-Live-Cam?continueFlag=4be7aad2ca0a560d6f9019228a8b2d3e

https://x.com/emollick/status/1822774265390985401

https://www.reddit.com/r/singularity/comments/1eo4sne/single_image_to_live_stream_deep_fake_deeplivecam/


本文来自微信公众号“新智元”,作者:新智元




关键词: AI , AI照片 , Flux , AI文生图
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI工作流

【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费)


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/(付费)

2
Flux

【部分开源免费】FLUX是由Black Forest Labs开发的一个文生图和图生图的AI绘图项目,该团队为前SD成员构成。该项目是目前效果最好的文生图开源项目,效果堪比midjourney。

项目地址:https://github.com/black-forest-labs/flux

在线使用:https://fluximg.com/zh

3
无人直播

【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。

项目地址:https://github.com/Henry-23/VideoChat

在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat


【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。

项目地址:https://github.com/PeterH0323/Streamer-Sales