“类Sora”的视频生成模型还不会成为腾讯高调挺进的领域。
《智能涌现》从多名独立信源处获悉,原腾讯混元大模型技术负责人之一刘威于近日离职。
对上述信息,截至发稿前,腾讯官方暂无回应。
多名从业者对《智能涌现》表示,刘威已经在新加坡创业,瞄准的还是视频生成领域。
原腾讯AI Lab计算机视觉中心负责人、混元大模型技术负责人刘威。图源:腾讯AI实验室微信公众号
在腾讯,具有“杰出科学家头衔”的刘威,最为人所知的身份是腾讯混元大模型的技术负责人之一。
此前,他曾任腾讯广告多媒体AI中心总监,带领团队基于混元大模型,研发了广告多媒体AI技术矩阵,提高了腾讯的广告转化效果和广告制作效率。
种种迹象表明,在验证落地场景和商业模式前,腾讯对视频生成的投入还十分谨慎。
一名从业者表示,图像、音频是目前腾讯多模态研究的重点:“技术成熟,成本可控,而且比较容易找场景。”比如,2024年11月,微信公众号最新版本上线了“朗读音色”功能,用AI实现了音色克隆。
“在腾讯,目前CV研究的主力在混元团队。但总体而言,腾讯对视频生成的人力和资源投入还不是很大。”上述从业者表示。
另有相关人士表示,腾讯AI Lab计算机视觉中心所配备的人力向来很少,刘威创业后又带走了多名成员,“总体而言,AI Lab对视频生成很佛”。
有关是否大力投入视频生成模型,如今中国互联网公司已经分成了泾渭分明的两派:
大举投入派,以字节跳动和快手为代表。2024年6月,快手发布了效果轰动一时的“可灵AI”;同年9月,不甘人后的字节一口气发了两款视频生成模型:Seaweed和PixelDance。
这些公司的特点在于,具有丰富的视频数据资源,以及能立刻与视频生成技术相结合业务场景。
而另一暂缓投入派,如百度,则对目前视频模型的商业回报,持有较为消极的态度。
此前《智能涌现》曾独家报道,在2024年Q3总监会上,百度董事长兼CEO李彦宏明确表示,Sora这种视频生成的投入周期太长了,10年、20年都可能拿不到业务收益,那么无论多么火爆,百度都不去做。
而腾讯对视频生成模型的态度天平,还尚未明晰。在明确落地场景和商业化回报之前,“类Sora”的视频生成模型还不会成为腾讯高调挺进的领域。
文章来自于“36氪”,作者“周鑫雨”