AI视频公司PixVerse发布PixVerse R1。一个全新的世界模型,终于让AI视频进入了“无限流”时代。

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AI视频公司PixVerse发布PixVerse R1。一个全新的世界模型,终于让AI视频进入了“无限流”时代。
9434点击    2026-01-14 11:49

昨晚夜里快12点,AI视频公司PixVerse毫无预兆的发了一个项目。


一个全新的世界模型,终于让AI视频进入了“无限流”时代。


PixVerse R1,下一代实时世界生成模型。


一个全新的世界模型,终于让AI视频进入了“无限流”时代。


这玩意你看文字,可能不是很好理解,我直接放一个官方的demo视频,大家的感觉应该会强一些。


AI视频公司PixVerse发布PixVerse R1。一个全新的世界模型,终于让AI视频进入了“无限流”时代。


上面是视频,下面是实时输入的Prompt。


整个过程,都是AI一直连续不断的生成视频,你可以在过程中用Prompt修改视频的进程,比如开头第一句Promtp,是士兵躺在雪山上,然后躺着躺着,你就输入了一个Prompt,说一只黑乌鸦飞过,飞完了以后,这个视频准备自己去做一些决策了自己去演后续的剧情了,你又有了新想法,于是,你又发了一段Prompt过去:


巡逻队发现了士兵。


每次你输入Prompt延迟2秒左右之后,你会发现,这个世界的剧情,就随着你的不断输入,不断的进行变化。


如果你不给Prompt干涉的话,他会自己一直演下去,最长的时间,在官方的技术报告里,写的是:


一个全新的世界模型,终于让AI视频进入了“无限流”时代。


无限、连续的视觉流式传输。


PixVerse将其称为,实时世界生成模型。


网址在此:https://pixverse.ai/en/blog/pixverse-r1-next-generation-real-time-world-model


项目报告我也看了一下。


还是蛮有意思的。


但是在实际给大家看这个项目之前,我觉得还是需要我们先统一一下,大家对于世界模型的定义,这样才更好去聊。


毕竟,世界模型这个词,这一两年,出现的太多了,以至于大家,好像完全不知道世界模型到底指向的是什么了。


我心中的世界模型,因为这一波23年到25年的生成式浪潮,所以其实是一个非常泛的定义:


能用一个可持续的内部状态,去预测世界接下来会怎样变化,并且能被交互和验证。


这也是为什么同一个词,经常会同时被拿来形容三类东西:


视频生成模型、可交互的生成世界、面向机器人和自动驾驶的物理仿真基础模型。


只要满足这个条件的,在目前的大众语境里,都可以被统称为,世界模型。


目前已有的世界模型代表,基本可以用几个项目,代表3个方向:


1. Google的Genie 3和Odyssey。


以Genie 3举例子。


我之前也写过文章:Google重磅上线通用世界模型Genie 3 - 此即未来。


一个全新的世界模型,终于让AI视频进入了“无限流”时代。


大概就是给一个文本提示,就能生成你可以实时导航的动态世界,24fps,720p,一致性可以维持到分钟级。


AI视频公司PixVerse发布PixVerse R1。一个全新的世界模型,终于让AI视频进入了“无限流”时代。


我极度极度看好世界模型,之前也极度的看好Genie的项目,我曾经甚至说,没有把Genie 3写火,让很多人关注到这个项目,是我们这些做AI内容的不专业和失职。


它代表的,是一次生成,然后可以在里面操控方向进行简单交互的视频类动态世界模型。


2. 李飞飞World Labs的Marble和混元3D世界模型。


以Marble举例子。


一个以三维空间智能为中心的多模态世界模型,


一个全新的世界模型,终于让AI视频进入了“无限流”时代。


World Labs给Marble的定义重点在3D,世界模型需要重建、生成、模拟三维世界,同时允许人和智能体在其中交互,这类路线的核心难点变成3D 表示和空间一致性,视频画面只是表层输出。


一个全新的世界模型,终于让AI视频进入了“无限流”时代。


它代表的,是一次生成,然后可以在里面进行简单交互的3D类世界模型。


3. 英伟达Cosmos。


一个非常纯粹的,为物理AI服务的世界基础模型平台。


一个全新的世界模型,终于让AI视频进入了“无限流”时代。


Cosmos的定位是面向自动驾驶、机器人、视频分析agent的WFM平台,强调数据处理、tokenizer、guardrails 和把世界模型用于高保真、物理相关的合成数据与后训练。


这条路线的评价标准更偏物理正确性、可控性、可用于训练与验证。


它代表的,是为训练具身智能和自动驾驶而生的世界模型。


这几个方向,基本就是现在世界模型方向的主流。


现在,相信大家也对世界模型,有了基本的差异化了解了,其他这玩意还是比较泛的,并没有一个特别明确的定义,路线又挺多,场景也挺多。


而这次,PixVerse的这个新的项目,为世界模型,补上了第四个方向,也是我自己过去一直期待的方向。


实时视频生成。


他们也上线了一个可以实测的demo版本可以玩。


网址在此:https://realtime.pixverse.ai/


一个全新的世界模型,终于让AI视频进入了“无限流”时代。


里面已经给了6个预设的模板,感觉后面还会更新更多。


我点了一下,发现,要邀请码。


一个全新的世界模型,终于让AI视频进入了“无限流”时代。


我就跑去问PixVerse的朋友,问他们为啥这年头了还要搞邀请码这事。


他们是这么说的:


一个全新的世界模型,终于让AI视频进入了“无限流”时代。


不过我还是舔着老脸,深夜要了一个邀请码过来。


实际去体验了一下。


这个体验的结果,我说实话,可能是我最近,体验的最快乐的产品了。


你们看完就知道,为啥快乐了。。。


拿到邀请码进去以后,我先随手点了最后一个那个卡通的模板。


一个全新的世界模型,终于让AI视频进入了“无限流”时代。


在页面上,你就会发现,有一个倒计时,大概意思就是,你只能在这个live里,体验五分钟,体验五分钟之后,就得新起一个窗口重来了。


核心原因,还是这玩意太烧算力了。


我点了进去。


一进去,这魔性的音乐,噔噔噔噔噔的,差点给我洗脑了。。。


然后,一双脚,就开始瞪着跑起来了。


我一定要给你们看看这个抽象的画面,我真的,凌晨2点多,在家里笑的嘎嘎的。


AI视频公司PixVerse发布PixVerse R1。一个全新的世界模型,终于让AI视频进入了“无限流”时代。


说实话,我硬生生看着小人跑了2分钟,我愣是一句话没发出去。。。


因为实在是太欢乐了,我就一直看着它跑,跑着跑着2分钟过去了,我都忘了我是可以随时更改剧情的。。。


然后,我又点开了他们那个1944的模板,疯狂的开始互动,这一次,我在家里笑出了猪叫,特别是最后,我让它从黑洞中穿梭,尽头是卡皮巴拉的时候。


我感觉我的大脑褶皱都抚平了。


AI视频公司PixVerse发布PixVerse R1。一个全新的世界模型,终于让AI视频进入了“无限流”时代。


真的,非常坦率的讲,PixVerse R1作为一个实验性的全新物种,在生成质量上,肯定还是有很强的进步空间的。


但是,作为一个全新的物种,它的实时生成,他的随时可交互。


这个快乐,如果不亲身体验一下的话,你是绝对感受不到的。


那是一种,你完全未知的快乐,但是你就是期待着,下一秒,他会发生什么。


你就是会期待着,你的那句话,会对这个屏幕里的小人,产生什么样的影响。


还有这个赛博朋克,也很好玩。


AI视频公司PixVerse发布PixVerse R1。一个全新的世界模型,终于让AI视频进入了“无限流”时代。


真的,我们看了太多太多套路话的故事,那种千篇一律没有新意的故事,这种实时生成的AI,由AI所造出的世界。


好像,会更让我惊喜,会更让我期待。


更别提,我还能用嘴,来指挥后续的动作了。


这里我强烈建议大家使用这个语音模式。


一个全新的世界模型,终于让AI视频进入了“无限流”时代。


相信我,你在玩的时候的卡点,可能是是打字速度跟不上你想要的剧情速度。


除了这些预设好的模板之外。


你当然,也可以去自定义。


一个全新的世界模型,终于让AI视频进入了“无限流”时代。


第一个想到的demo,其实就是一个我还满喜欢的游戏,无人深空,因为这个游戏,跟实时生成实在太契合了。


我直接直接发了个起始Prompt过去:


这是一个正在运行的科幻探索类游戏画面,不是被摄像机拍摄的影像。画面以稳定的游戏视角呈现,不存在摄影机跟随、推拉或电影化运镜。世界由程序生成并持续运行,角色只是世界中的一部分,画面变化来自世界状态的演化。


然后,这个探索,就开始了。


AI视频公司PixVerse发布PixVerse R1。一个全新的世界模型,终于让AI视频进入了“无限流”时代。


非常的酷非常的有意思。


还有,街霸PK。


AI视频公司PixVerse发布PixVerse R1。一个全新的世界模型,终于让AI视频进入了“无限流”时代。


真的,太好玩了。


好久没有用AI,这么纯粹的快乐了。


我非常开心,能见到我们未来的娱乐形态,可能又会多一种非常好玩的方式。


也许再过几年,所谓的电影、综艺、游戏,根本就不再是固定时长的文件,而是一条条永远流动着的世界时间线。


创作者给一个起点,给一些世界观设定,剩下的交给世界模型自己往前长,观众进来以后,用一句话、一个表情、一次选择,把剧情轻轻拽偏一点。


所有人看到的,都是同一个宇宙,但却是不同的一条时间支线。


虽然让人人创造内容,是一种奢望。


但,在人的本源里,我觉得,每个人还是享受,创造的乐趣的。


这一天。


可能是AI模型历史上,会标红的一页。


很新,很有趣,但同时。


也很未来。


文章来自于“数字生命卡兹克”,作者 “卡兹克”。

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。

项目地址:https://github.com/browser-use/browser-use


2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

3
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0