人人都是导演:CineCtrl首个实现视频生成中的相机运镜与摄影效果统一控制
人人都是导演:CineCtrl首个实现视频生成中的相机运镜与摄影效果统一控制现有视频生成模型往往难以兼顾「运镜」与「摄影美学」的精确控制。为此,华中科技大学、南洋理工大学、商汤科技和上海人工智能实验室团队推出了 CineCtrl。作为首个统一的视频摄影控制 V2V 框架,CineCtrl 通过解耦交叉注意力机制,摆脱了多控制信号共同控制的效果耦合问题,实现了对视频相机外参轨迹与摄影效果的独立、精细、协调控制。
现有视频生成模型往往难以兼顾「运镜」与「摄影美学」的精确控制。为此,华中科技大学、南洋理工大学、商汤科技和上海人工智能实验室团队推出了 CineCtrl。作为首个统一的视频摄影控制 V2V 框架,CineCtrl 通过解耦交叉注意力机制,摆脱了多控制信号共同控制的效果耦合问题,实现了对视频相机外参轨迹与摄影效果的独立、精细、协调控制。
OpenAI又双叒要融资了!据知情人士透露,OpenAI正在与亚马逊等投资者接触,计划筹集1000亿美元资金。 如果能够筹得目标金额,OpenAI的投后估值可能升至约8300亿美元。
起猛了,怎么在演唱会看到人形机器人跳「韦伯斯特」了! 真就一个大写的「Wow」!12 月 18 日,在王力宏「最好的地方」巡回演唱会成都站现场,六台人形机器人随《火力全开》歌曲登台与歌手及舞者同台表演。
最近各种年度回顾陆续上线, OpenAI 的前联合创始人 Andrej Karpathy 也交出了自己对大模型的年度总结。就在今年早些时候,他在 YC 的一场演讲刷爆了全网,提出了不少新的观点:
三年前点燃大模型革命的 OpenAI,正在被算力成本、开源浪潮与分发缺口拖入泥潭。与之相反,谷歌用 Gemini 与全栈生态完成反击,把 AI 塞入搜索、安卓与广告。领先者与追赶者在 2025 年末交换了位置。
美国能源部联手OpenAI、谷歌等24巨头,启动国家AI「创世纪计划」!从此,硅谷+白宫联手,核能、量子、材料科学将实现新突破。媒体称:AI曼哈顿计划,正式启动了。
只做 63 次实验,从 100 多万中可能的配方组合中,找到了最优解。这是清华大学教授罗三中和团队的最新成果,他们使用AI找到了一个高效的全新化学反应宝藏。这个反应可以使用钴配合物和一种名为烯胺的中间体进行巧妙结合,把生活中常见的醛类分子变成药物或者材料中间体,事实上日常中的很多香料和气味就来自于醛类分子。
本周四消息,于两年前创立亚马逊 AGI 团队的高级副总裁兼首席科学家 Rohit Prasad 已官宣离职。
智能体元年已至,AI下半场的“生产力战争”已经打响。
AI不仅能回答问题,还能采访人类了。Anthropic让模型与1250名真实用户深度对话,自动写提纲、追问、做聚类分析,最后画出一张「人类情绪雷达图」。这一次,人类成了AI的研究对象。