
Sora三巨头首次解密幕后信息,CTO:最快年内开放
Sora三巨头首次解密幕后信息,CTO:最快年内开放“Sora最快今年内开放公测。” 在一场访谈中,OpenAI CTO Mira Murati亲自透露了这一消息。
“Sora最快今年内开放公测。” 在一场访谈中,OpenAI CTO Mira Murati亲自透露了这一消息。
具身基础模型突破2D,全新生成式视觉-语言-行动模型3D-VLA,在多项任务中显著提高了推理、多模态生成和规划的能力。
一个月前(2月15日),Sora和 Gemini 1.5 同时推出,这个故事很多人都听过了,Google 被冠以 AI 界汪峰的名头。人们纷纷震惊于 Sora 的强大,讨论 Sora 是不是世界模型。而 Gemini 1.5 的第一个模型 Gemini 1.5 Pro 在发布后没多久就逐渐无人问津了。
Sora出世前,他们拿着一篇如今被ICLR 2024接收的论文,十分费劲地为投资人、求知者讲了大半年,却处处碰壁。
Sora 的发布让整个 AI 领域为之狂欢,但 LeCun 是个例外。
谷歌DeepMind、UC伯克利和MIT的研究人员认为,如果用大语言模型的思路来做大视频模型,能解决很多语言模型不擅长的问题,可能能更进一步接近世界模型。
真正的「基础世界模型」诞生了!谷歌团队发布110亿参数Genie「精灵」,从一张图片就能创造出可玩的虚拟世界,动作可控碾压Sora。网友惊叹,AI已经杀到视频游戏领域了。
世界模型是什么?Sora是世界模型吗?
最近几天,Sora 成为了全世界关注的焦点。与之相关的一切,都被放大到极致。
问世才两个星期,谷歌的世界模型也来了,能力看起来更强大:它生成的虚拟世界「自主可控」。