
通信巨头入局视频生成,直接霸榜权威评测:人物跨越多场景依然一致
通信巨头入局视频生成,直接霸榜权威评测:人物跨越多场景依然一致视频生成模型评测权威榜单VBench,突遭“屠榜”。
来自主题: AI资讯
6182 点击 2024-12-05 14:56
视频生成模型评测权威榜单VBench,突遭“屠榜”。
首个由万卡集群训练出来的万亿参数大模型,被一家央企解锁了。
更适配中文的语音大模型来了—— 来自中国电信人工智能研究院,AI领域Fellow大满贯科学家李学龙带队,发布首个能听懂30多种多方言混说的大模型。 号称最难方言、“魔鬼的语言”的温州话,也不在话下。
本论文作者包括帝国理工学院硕士生杨润一、北航二年级硕士生朱贞欣、北京理工大学二年级硕士生姜洲、北京理工大学四年级本科生叶柏均、中国科学院大学本科大三学生张逸飞、中国电信人工智能研究院多媒体认知学习实验室(EVOL Lab)负责人赵健、清华大学智能产业研究院(AIR)助理教授赵昊等。