揭秘Sora:用大语言模型的方法理解视频,实现了对物理世界的“涌现”
揭秘Sora:用大语言模型的方法理解视频,实现了对物理世界的“涌现”简单粗暴的理解,就是语言能力足够强大之后,它带来的泛化能力直接可以学习图像视频数据和它体现出的模式,然后还可以直接用学习来的图像生成模型最能理解的方式,给这些利用了引擎等已有的强大而成熟的视频生成技术的视觉模型模块下指令,最终生成我们看到的逼真而强大的对物理世界体现出“理解”的视频。
来自主题: AI资讯
8338 点击 2024-02-17 12:52