
免剪辑直出!AI生成多角色同框对话视频,动态路由精准绑定音频
免剪辑直出!AI生成多角色同框对话视频,动态路由精准绑定音频Bind-Your-Avatar是一个基于扩散Transformer(MM-DiT)的框架,通过细粒度嵌入路由将语音与角色绑定,实现精准的音画同步,并支持动态背景生成。该框架还引入了首个针对多角色对话视频生成的数据集MTCC和基准测试,实验表明其在身份保真和音画同步上优于现有方法。
来自主题: AI技术研报
6085 点击 2025-07-18 11:44
Bind-Your-Avatar是一个基于扩散Transformer(MM-DiT)的框架,通过细粒度嵌入路由将语音与角色绑定,实现精准的音画同步,并支持动态背景生成。该框架还引入了首个针对多角色对话视频生成的数据集MTCC和基准测试,实验表明其在身份保真和音画同步上优于现有方法。
近日,由天桥脑科学研究院(Tianqiao and Chrissy Chen Institute,TCCI)、《Science》杂志及上海市精神卫生中心联合主办的“人工智能与精神健康”研讨会在上海成功举行。
德国新兴远程医疗AI公司TCC完成 A 轮融资,融资金额高达2000万欧元此轮融资由德国航运及物流企业家托马斯·波茨施船长领投,标志着 TCC 在为医院提供可扩展远程重症监护解决方案的征程上迈出关键一步。波茨施船长不仅提供资金支持,还将亲自给予指导,助力 TCC 按照医院改革目标实现门诊护理数字化并扩大其可及性。
12月25日下午,据“天桥脑科学研究院”官方帐号消息,盛大集团创始人陈天桥创立的天桥脑科学研究院(Tianqiao and Chrissy Chen Institute,简称TCCI)近日宣布,追加10亿元人民币投入“人工智能(AI)+脑科学”,旨在推动人类智慧和机器智慧的相互结合与促进。