AI资讯新闻榜单内容搜索-世界模型

南大等8家单位，38页、400+参考文献，物理模拟器与世界模型驱动的机器人具身智能综述

本文作者来自：南京大学、香港大学、中南大学、地平线、中国科学院计算所、上海交通大学、慕尼黑工业大学、清华大学。

来自主题: AI技术研报

7118 点击 2025-07-15 15:25

Meta发布40页报告，具身智能的下一步是「心智世界模型」：能听，能看，能理解，会共情

这篇报告第一次把对人心智状态的推断，放到和物理世界模型（physical world model）同等重要的位置上，并将其概念化为心智世界模型（mental world model）。相比于传统世界模型（如LeCun的JEPA）仅关注物理规律（物体运动、机械因果），心智世界模型则首次将心理规律（意图、情感、社会关系）纳入世界模型框架，实现“双轨建模”。

来自主题: AI资讯

5858 点击 2025-07-11 12:25

「世界模型」也被泼冷水了？邢波等人揭开五大「硬伤」，提出新范式

现在的世界模型，值得批判。我们知道，大语言模型（LLM）是通过预测对话的下一个单词的形式产生输出的。由此产生的对话、推理甚至创作能力已经接近人类智力水平。

来自主题: AI技术研报

5814 点击 2025-07-10 10:57

独家对话云深处CEO朱秋国：给机器人安上“世界模型”，就不需要那么多数据了

即使有一颗大隐隐于市的心，成立第八年的云深处，终究在今天具身智能的浪潮下，被推到了舞台中央。

来自主题: AI资讯

7039 点击 2025-07-09 10:43

750城市+5000小时第一人称视频，上海AI Lab开源面向世界探索高质量视频数据集

现在，国内研究机构就从数据基石的角度出发，拿出了还原真实动态世界的新进展：上海人工智能实验室、北京理工大学、上海创智学院、东京大学等机构聚焦世界生成的第一步——世界探索，联合推出一个持续迭代的高质量视频数据集项目——Sekai（日语意为“世界”），服务于交互式视频生成、视觉导航、视频理解等任务，旨在利用图像、文本或视频构建一个动态且真实的世界，可供用户不受限制进行交互探索。

来自主题: AI技术研报

6019 点击 2025-07-07 11:22

首次！世界模型、动作模型融合，全自回归模型WorldVLA来了

阿里巴巴达摩院提出了 WorldVLA, 首次将世界模型 (World Model) 和动作模型 (Action Model/VLA Model) 融合到了一个模型中。WorldVLA 是一个统一了文本、图片、动作理解和生成的全自回归模型。

来自主题: AI技术研报

6090 点击 2025-07-03 18:59

伯克利&Meta面向具身智能的世界模型：让AI通过全身动作「看见」未来

几十年来，人工智能领域一直在思考一个看似简单但非常根本的问题：如果一个智能体要在真实世界中行动、规划，并且和环境互动，它需要一个怎样的「世界模型」？

来自主题: AI技术研报

7774 点击 2025-07-01 15:01

视频世界模型JEPA‑2与Meta AI的具身智能系统

JEPA-2（V-JEPA 2）是Meta最新推出的视频世界模型，采用视图嵌入预测（Joint Embedding Predictive Architecture）框架进行自监督预训练。

来自主题: AI资讯

5501 点击 2025-07-01 10:30

具身世界模型新突破，地平线 & 极佳提出几何一致视频世界模型增强机器人策略学习

近年来，随着人工智能从感知智能向决策智能演进，世界模型（World Models）逐渐成为机器人领域的重要研究方向。世界模型旨在让智能体对环境进行建模并预测未来状态，从而实现更高效的规划与决策。

来自主题: AI技术研报

6976 点击 2025-06-26 16:05

全在这里了，小白也可以一文读懂的“世界模型”

我们先来回顾一下近期相关事件： 6 月 18 日，Midjourney 发布首个 AI 视频生成模型 V1，标志其从静态图像创作向动态多媒体内容生产转型。V1 支持上传或用其他模型生成图像来生成视频片段，但有无法生成音频、时长限制等不足。Midjourney 透露长期目标是将多种技术融合为"世界模型"，使用户能在动态生成的虚拟环境中自由探索。

来自主题: AI资讯

4970 点击 2025-06-26 10:37