
“世界模型”大争议:杨立昆狠批Sora不是世界模型,生成式路线注定失败
“世界模型”大争议:杨立昆狠批Sora不是世界模型,生成式路线注定失败杨立昆:Sora不是世界模型,V-JEPA才是。
杨立昆:Sora不是世界模型,V-JEPA才是。
威尔·史密斯的这段视频,把全网都骗了!其实Sora的技术路线,早已被人预言了。李飞飞去年就用Transformer做出了逼真的视频。但只有OpenAI大力出奇迹,跑在了所有人前面。
AI 视频生成的「ChatGPT时刻」比想象中提前了6个月。Sora 的诞生意味着什么,何以堪称「世界的模拟器」?
卷疯了!世界最快的大模型Groq一夜之间爆火,能够每秒输出近500个token。如此神速的响应,背后全凭自研的LPU。
我们接连被谷歌的多模态模型 Gemini 1.5 以及 OpenAI 的视频生成模型 Sora 所震撼到,前者可以处理的上下文窗口达百万级别,而后者生成的视频能够理解运动中的物理世界,被很多人称为「世界模型」。
现实不存在了?这么说还为时尚早。最近,Sora各种不符合现实的图出圈了,惹网友爆笑。LeCun、DeepMind大佬、马斯克都纷纷下场了,而一位动画师表示,自己完全不担心被Sora淘汰。
短短几天,「世界模型」雏形相继诞生,AGI真的离我们不远了?Sora之后,LeCun首发AI视频预测架构V-JEPA,能够以人类的理解方式看世界。
为何Sora会掀起滔天巨浪?Sora的技术,就是机器模拟我们世界的下一步。而且今天有人扒出,Sora创新的核心秘密时空Patches,竟是来自谷歌DeepMind和谢赛宁的论文成果。
最近来自香港科技大学(HKUST)、南洋理工大学(NTU)与加利福尼亚大学洛杉矶分校(UCLA)的研究者们提供了新的思路:他们发现大语言模型如 ChatGPT 可以理解传感器信号进而完成物理世界中的任务。该项目初步成果发表于 ACM HotMobile 2024。
2023 年是当之无愧的「AI+大模型」之年,以 ChatGPT 为代表的生成式 AI 的神速进展,让人们甚至认为大语言模型已经有资格被称作「世界模型」——人工智能从未像今天这样离「神性」如此接近。