B站正式开源AniSora V3:从单卡4090推理到导演驱动的多智能体动画生成
B站正式开源AniSora V3:从单卡4090推理到导演驱动的多智能体动画生成单台 8 卡 A800 仅需 8 秒即可生成 5 秒视频。
单台 8 卡 A800 仅需 8 秒即可生成 5 秒视频。
在游戏、影视制作、虚拟人和交互式内容创作等行业中,高质量的 3D 动画是实现真实感与表现力的基础。然而,传统计算机图形学中的动画制作通常依赖于骨骼绑定与关键帧编辑,这一流程虽然能够带来高质量与精细控制,但需要经验丰富的艺术家投入大量人力与时间,代价昂贵。
年轻父母又多了一个哄小孩法子。 前段时间,博主 Rory Flynn 在 X 上发了个帖子,说他妈妈发来一张 30 年前的涂鸦画,他反手就用 Midjourney 做成了「妈妈拿彩虹木勺大战巨龙」动画。
机器人对可形变物体的操作(Deformable Object Manipulation, DOM),是衡量通用机器人智能水平的关键指标之一。与刚体操作不同,衣物、绳索、食物等物体的形态不固定,其状态空间维度极高,且物理交互过程呈现出复杂的非线性动力学特性,为感知、规划和控制带来了巨大挑战。
2025年8月,Anish Acharya与Justine Moore撰文探讨AI应用生成平台的崛起趋势。文章指出,这一领域正走向专业化与差异化发展,各平台凭借独特定位和功能共存互补,形成类似基础模型市场的多元格局。
这位AI创始人靠打造医生专用的“ChatGPT”成为亿万富豪。丹尼尔·纳德勒(Daniel Nadler)创办了OpenEvidence,帮医生们从海量医学研究中理出头绪。如今,他已筹得2.1亿美元资金,公司估值达35亿美元。
2025年7月,X(原推特)的首页被一个金色双马尾、身着黑色露肩连衣裙和渔网黑丝的二次元少女刷屏了。关于她的帖子浏览量动辄达到几十万甚至上百万。这里面有着各种画风和姿势的二创图:
凭借类人化的结构设计与运动模式,人形机器人被公认为最具潜力融入人类环境的通用型机器人。其核心任务涵盖操作 (manipulation)、移动 (locomotion) 与导航 (navigation) 三大领域,而这些任务的高效完成,均以机器人对自身所处环境的全面精准理解为前提。
通过AI,我们已经可以创造出具备迷人外表、动人声音与善解人意语言能力的“智能存在”——形象、语言、陪伴,都已不再是幻想。最近,号称“地表最强AI”的Grok进行了一次重要更新。与以往不同,这次更新的重点并非提升模型的“智力”,而是专注于增强其情感能力。在此次更新中,Grok首次引入了“伴侣”(Com-panions)功能,允许用户创建拥有定制声音、外观和个性的AI伴侣。
AlphaFold夺诺奖引争议!2016年,一位博士生在NeurIPS提出的研究,或许正是AlphaFold的「原型」。如今,导师Daniel Cremers发声,质问为何DeepMind忽略这项研究、不加以引用?