
AI恐怖体操视频腿脚乱飞、大变活人,LeCun:视频生成模型根本不懂物理
AI恐怖体操视频腿脚乱飞、大变活人,LeCun:视频生成模型根本不懂物理一段AI生成的体操视频,引发近百万网友围观,LeCun等一众大佬还因为它吵起来了。
一段AI生成的体操视频,引发近百万网友围观,LeCun等一众大佬还因为它吵起来了。
只需几分钟、一张图或一句话,就能完成时空一致的4D内容生成。
AI卫星影像知识生成模型数据集稀缺的问题,又有新解了。
继Sora官宣之后,多模态大模型在视频生成方面的应用简直就像井喷一样涌现出来,LUMA、Gen-3 Alpha等视频生成模型展现了极佳质量的艺术风格和视频场景的细节雕刻能力,文生视频、图生视频的新前沿不断被扩展令大家惊喜不已,抱有期待。
这几天,最新发布的Stable Diffusion 3和Luma AI的视频生成模型Dream Machine相继发布,但这两个模型却用非常独特的方式震撼到了网友们。Dream Machine加上二创脑洞成为快乐源泉,SD3输出的诡异图片却散发着浓浓的「黑色幽默」。
检索增强生成 (RAG) 是将检索模型与生成模型结合起来,以提高生成内容的质量和相关性的一种有效的方法。RAG 的核心思想是利用大量文档或知识库来获取相关信息。各种工具支持 RAG,包括 Langchain 和 LlamaIndex。
音频生成领域又有好消息:刚刚,Stability AI 宣布推出开放模型 Stable Audio Open,该模型能够生成高质量的音频数据。
北航的研究团队,用扩散模型“复刻”了一个地球? 在全球的任意位置,模型都能生成多种分辨率的遥感图像,创造出丰富多样的“平行场景”。 而且地形、气候、植被等复杂的地理特征,也全都考虑到了。
最近的一系列研究表明,纯解码器生成模型可以通过训练利用下一个 token 预测生成有用的表征,从而成功地生成多种模态(如音频、图像或状态 - 动作序列)的新序列,从文本、蛋白质、音频到图像,甚至是状态序列。
无需采集3D数据,也能训练出高质量的3D自动驾驶场景生成模型。