
清华、华为等提出iVideoGPT:专攻交互式世界模型
清华、华为等提出iVideoGPT:专攻交互式世界模型iVideoGPT,满足世界模型高交互性需求。
iVideoGPT,满足世界模型高交互性需求。
这才是 AI 视频生成的未来?
在图像生成领域占据主导地位的扩散模型,开始挑战强化学习智能体。
世界模型,即通过预测未来的范式对数字世界和物理世界进行理解,是通往实现通用人工智能(AGI)的关键路径之一。
LLM已经可以理解文本和图片了,也能够根据它们的历史知识回答各种问题,但它们或许对周围世界当前发生的事情一无所知
通过什么方式够实现通用人工智能? 近期由AGI House组织的一场主题演讲给出了解答。
来自UC berkeley的研究人员开源了首个世界模型,多模态性能优秀,长视频理解吊打GPT-4,同时将上下文长度增加到百万级别
我们就是奔着AGI去的,不然这群人聚在一起干嘛?2024年2月,在准备一场分享会的PPT中,前微软全球副总裁、如今的阶跃星辰CEO姜大昕,把他看到的一句评论放进了自我介绍: 在微软混得风生水起,怎么想不开创业?
“Sora最快今年内开放公测。” 在一场访谈中,OpenAI CTO Mira Murati亲自透露了这一消息。
具身基础模型突破2D,全新生成式视觉-语言-行动模型3D-VLA,在多项任务中显著提高了推理、多模态生成和规划的能力。