重写《给阿嬷的情书》结局:哈工大张民团队联合阿里开源全流程AI多智能体导演框架VideoClaw
重写《给阿嬷的情书》结局:哈工大张民团队联合阿里开源全流程AI多智能体导演框架VideoClaw早在 2023 年大模型快速发展期,哈工大张民教授立知大模型团队已开展多模态大模型驱动的视频内容创作智能体研究,并全球首发开源了电影制作智能体 FilmAgent 与动画片生成智能体 Anim-Director,受到国内外智能体研究者与文艺创作者的广泛关注。
搜索
早在 2023 年大模型快速发展期,哈工大张民教授立知大模型团队已开展多模态大模型驱动的视频内容创作智能体研究,并全球首发开源了电影制作智能体 FilmAgent 与动画片生成智能体 Anim-Director,受到国内外智能体研究者与文艺创作者的广泛关注。
2026年5月,历史发生了一次注定载入史册的折叠。教皇联手硅谷巨头,亲口承认AI已失控:2030年AGI降临,仅剩3年自救窗口,人类精神将被全面接管?
同一周,ClickUp 裁员 22%,同时宣布开出 100 万美元年薪的薪酬区间,专门用来吸引「AI 原生」人才。Wix、Webflow、Meta 随后也做了类似的举动。原文:How to become the AI-native hire every company wants, @anitakirkovska,May 2026
YC 官方账号亲自下场推了一家叫 Manicule 的公司——专门给开发者工具团队承包技术文档和 DevRel 内容,核心卖点:成本只要 DevRel 的一半,速度快一倍,而且文档专门为 AI agent 优化。当 Codex、Claude Code 这些编程 agent 开始直接读你的 docs 来调 API,文档质量差就等于把客户拱手让给竞品。
VeRL-Omni 是一个面向多模态生成模型的通用 RL 后训练框架,由 VeRL-Omni 团队在 verl 与 vllm-omni 之上构建。覆盖扩散 transformer(Qwen-Image)、混合 AR-DiT(Qwen-Omni)、统一理解 + 生成(BAGEL、HunyuanImage-3.0)等架构。
世界模型是个依然模糊和遥远的概念。
Mechanize 发布了一项硬核测试:给前沿 AI coding agents 24 小时,用 Rust 从零写一个完整的 Game Boy Advance 模拟器,再和顶级开源模拟器 Mesen2 逐帧对比打分。
视频创作正在从操作工具,变成一场人与Agent之间的对话。
王珏 (左)方晨(右) 推荐语 动画是一个被低估的品类。它比真人影视更早拥抱数字化工具,比短视频承载更复杂的叙事,从迪士尼到吉卜力,证明了自己能撑起全年龄段的内容消费和完整的商业闭环。但动画的产能瓶颈
就在上周,旧金山“Code with Claude”开发者大会上,Anthropic CEO Dario Amodei 和 总裁 Daniela Amodei 兄妹二人同台对话。主持人 Ami Vora 是 Anthropic 的首席产品官,曾任职于微软、Meta。