影眸科技吴迪:3D生成是「空间智能」的最后一块拼图丨36氪专访
影眸科技吴迪:3D生成是「空间智能」的最后一块拼图丨36氪专访3D生成的“ChatGPT”时刻来了?
3D生成的“ChatGPT”时刻来了?
SceneX是一个创新的3D场景生成框架,能根据简单的文字描述快速创建高质量、逼真的虚拟场景,大幅提高构建虚拟世界的效率和灵活性。
李飞飞、谢赛宁团队又有重磅发现了:多模态LLM能够记住和回忆空间,甚至内部已经形成了局部世界模型,表现了空间意识!李飞飞兴奋表示,在2025年,空间智能的界限很可能会再次突破。
我们生活在一个感官丰富的 3D 世界中,视觉信号围绕着我们,让我们能够感知、理解和与之互动。
2024年的李飞飞是斯坦福大学的计算机科学教授,是斯坦福以人为本人工智能研究院(HAI)的院长,也是AI创业公司World Labs的创始人。
人类的沟通交流充满了多模态的信息。为了与他人进行有效沟通,我们既使用言语语言,也使用身体语言,比如手势、面部表情、身体姿势和情绪表达。
遵循世界的 3D 特性,很多事就会变得自然而然。 说到斯坦福大学教授李飞飞(Fei-Fei Li),她提倡的「空间智能」最近正在引领 AI 发展方向。
上周,李飞飞空间智能首个3D生成模型刚刚交卷。这边,国内来自智源的See3D模型,在学习了无标注的1600万个视频之后,重建出全新的3D世界,效果令人惊叹。
就在刚刚,李飞飞空间智能首个项目突然发布: 仅凭借1张图,就能生成一个3D游戏世界的AI系统!
斯坦福吴佳俊团队,给机器人设计了一套组装宜家家具的视频教程!