大视频模型是世界模型?DeepMind/UC伯克利华人一作:预测下一帧就能改变世界
大视频模型是世界模型?DeepMind/UC伯克利华人一作:预测下一帧就能改变世界谷歌DeepMind、UC伯克利和MIT的研究人员认为,如果用大语言模型的思路来做大视频模型,能解决很多语言模型不擅长的问题,可能能更进一步接近世界模型。
来自主题: AI技术研报
6188 点击 2024-03-03 17:31
谷歌DeepMind、UC伯克利和MIT的研究人员认为,如果用大语言模型的思路来做大视频模型,能解决很多语言模型不擅长的问题,可能能更进一步接近世界模型。