AI资讯新闻榜单内容搜索-世界模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 世界模型
让VLM学会「心中有世界」:VAGEN用多轮RL把视觉智能变成「世界模型」推理机器

让VLM学会「心中有世界」:VAGEN用多轮RL把视觉智能变成「世界模型」推理机器

让VLM学会「心中有世界」:VAGEN用多轮RL把视觉智能变成「世界模型」推理机器

当今的 AI 智能体(Agent)越来越强大,尤其是像 VLM(视觉-语言模型)这样能「看懂」世界的智能体。但研究者发现一个大问题:相比于只处理文本的 LLM 智能体,VLM 智能体在面对复杂的视觉任务时,常常表现得像一个「莽撞的执行者」,而不是一个「深思熟虑的思考者」。

来自主题: AI技术研报
6722 点击    2025-10-28 09:26
Efficiency Law, 物理精确世界模型,及世界模型引擎驱动的具身智能学习新范式

Efficiency Law, 物理精确世界模型,及世界模型引擎驱动的具身智能学习新范式

Efficiency Law, 物理精确世界模型,及世界模型引擎驱动的具身智能学习新范式

2025 年秋的具身智能赛道正被巨头动态点燃:特斯拉上海超级工厂宣布 Optimus 2.0 量产下线,同步开放开发者平台提供运动控制与环境感知 SDK,试图通过生态共建破解数据孤岛难题;英伟达则在 SIGGRAPH 大会抛出物理 AI 全栈方案,其 Omniverse 平台结合 Cosmos 世界模型可生成高质量合成数据,直指真机数据短缺痛点。

来自主题: AI技术研报
7902 点击    2025-10-27 17:05
斯坦福具身智能大佬引用,Huggingface官方催更:北京人形开源WoW具身世界模型

斯坦福具身智能大佬引用,Huggingface官方催更:北京人形开源WoW具身世界模型

斯坦福具身智能大佬引用,Huggingface官方催更:北京人形开源WoW具身世界模型

在「具身智能」与「世界模型」成为新一轮 AI 竞赛关键词的当下,来自北京人形机器人创新中心、北京大学多媒体信息处理国家重点实验室、香港科技大学的中国团队开源了全新的世界模型架构。

来自主题: AI技术研报
7537 点击    2025-10-19 12:34
李飞飞全新「世界模型」问世!单张H100实时生成3D永恒世界

李飞飞全新「世界模型」问世!单张H100实时生成3D永恒世界

李飞飞全新「世界模型」问世!单张H100实时生成3D永恒世界

一张图,一个3D世界!今天,李飞飞团队重磅放出实时生成世界模型「RTFM」,通过端到端学习大规模视频数据,直接从输入2D图像生成同一场景下新视角的图像。值得一提的是,它仅需单块H100 GPU便能实时渲染出持久且3D一致的世界。

来自主题: AI资讯
8491 点击    2025-10-17 11:55
李飞飞发布全新世界模型,单GPU就能跑!

李飞飞发布全新世界模型,单GPU就能跑!

李飞飞发布全新世界模型,单GPU就能跑!

李飞飞的世界模型创业,最新成果来了!刚刚,教母亲自宣布对外推出全新模型RTFM(A Real-Time Frame Model),不仅具备实时运行、持久性和3D一致性,更关键的是——单张H100 GPU就能跑。

来自主题: AI资讯
9983 点击    2025-10-17 09:08
马斯克从英伟达挖人做AI游戏!第一步:研发世界模型

马斯克从英伟达挖人做AI游戏!第一步:研发世界模型

马斯克从英伟达挖人做AI游戏!第一步:研发世界模型

马斯克的xAI也入局世界模型了!据《金融时报》(FT)报道,为了增加这场“世界模型大混战”的赢面,今年夏天,xAI已经从英伟达挖来了多名资深研究员来助阵。另一边,在悄然下场世界模型后,马斯克几天前又在𝕏上再次重申了去年定下的那个“小目标”——

来自主题: AI资讯
8830 点击    2025-10-13 11:55
任少卿的智驾非共识:世界模型、长时序智能体与 “变态” 工程主义

任少卿的智驾非共识:世界模型、长时序智能体与 “变态” 工程主义

任少卿的智驾非共识:世界模型、长时序智能体与 “变态” 工程主义

任少卿的头发很有辨识度,浓密、微卷,刘海盖住额头。走进会议室,第一次见他的人把他当成了实习生,知道身份后调侃说,只有在 AI 创业公司才能看到这么年轻的技术 leader。

来自主题: AI资讯
9449 点击    2025-10-12 15:00
Meta的代码生成世界模型CWM,先预测结果再写代码,IDE很快会多一个“预言”按钮

Meta的代码生成世界模型CWM,先预测结果再写代码,IDE很快会多一个“预言”按钮

Meta的代码生成世界模型CWM,先预测结果再写代码,IDE很快会多一个“预言”按钮

您修过Bug吗?在Vibe coding的时代之前,当程序员遇到自己写的 Bug 时,通常能顺着自己的思路反推问题所在。但当面对 AI 生成的 Bug 时,情况变得复杂得多,我们不清楚 AI 的“思考

来自主题: AI技术研报
7568 点击    2025-10-09 11:06
Insta360最新全景综述:全景视觉的挑战、方法与未来

Insta360最新全景综述:全景视觉的挑战、方法与未来

Insta360最新全景综述:全景视觉的挑战、方法与未来

本文作者团队来自 Insta360 影石研究院及其合作高校。目前,Insta360 正在面向世界模型、多模态大模型、生成式模型等前沿方向招聘实习生与全职算法工程师,欢迎有志于前沿 AI 研究与落地的同

来自主题: AI技术研报
6462 点击    2025-10-06 14:46