Veo何止生成视频:DeepMind正在用它模拟整个机器人世界
Veo何止生成视频:DeepMind正在用它模拟整个机器人世界随着通用型(Generalist)机器人策略的发展,机器人能够通过自然语言指令在多种环境中完成各类任务,但这也带来了显著的挑战。
随着通用型(Generalist)机器人策略的发展,机器人能够通过自然语言指令在多种环境中完成各类任务,但这也带来了显著的挑战。
给你 30s,介绍一下今天你的 OOTD 吧。
自 Sora 2 发布以来,各大科技厂商迎来新一轮视频生成模型「军备竞赛」,纷纷赶在年底前推出更强的迭代版本。
Flaviu Radulescu于2023年创立Runware,当时他在测试一家文本转图像公司时意识到,尽管生成式AI技术很强大,但生成图像的速度很慢。
4人28天手搓Sora APP,约85%代码竟是AI写的!10月初,OpenAI重磅发布迭代后Sora 2,以及首个AI视频应用Sora APP。时隔两个月,OpenAI团队揭秘这款爆火应用(首个安卓版),如何构建的背后故事。
不仅能“听懂”物体的颜色纹理,还能“理解”深度图、人体姿态、运动轨迹……
想象一下,只需要一句话描述,AI 就能为你拍出一部完整的短剧?为了让这个想法变成现实,香港大学黄超教授团队开源了 ViMax 框架,并在 GitHub 获得 1.4k + 星标,专注于 Agentic Video Generation 的前沿探索。通过多智能体协作,ViMax 实现了真正的 "自编自导自演"—— 从创意构思到成片输出的完整自动化,把传统影视制作的每个环节都搬进了 AI 世界。
为了让“米老鼠”加入Sora,OpenAI刚刚正式官宣与迪士尼达成合作。 协议内容之一即为,OpenAI需向迪士尼出售价值10亿美元的公司股权,而且迪士尼还获得未来增持的权利。消息一出,彭博社带头吃瓜,文章标题更是相当赤裸裸:
主攻 AI 视频与多媒体生成技术的独角兽 Runway 也来了一波大的:一口气来了 5 个「激动人心的宣布」。这一波更新之猛,甚至让人觉得他们是不是把过去半年的大招一次性全放了出来。Runway 这一波发布,不仅刷新了视频生成的各项指标,更重要的是,他们正式对外展示了其在通用世界模型(General World Models/GWM)上的野心。
如果把今年的AI创业图景抽象成一幅热力分布图,会看到一个异常明亮的区域。它不在模型底座层,不在搜索、办公、投喂式工具链,而是意外地集中在一个节点:视频生成。