ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
腾讯混元技术负责人之一刘威,离职创业
6069点击    2024-11-19 21:13

“类Sora”的视频生成模型还不会成为腾讯高调挺进的领域。


《智能涌现》从多名独立信源处获悉,原腾讯混元大模型技术负责人之一刘威于近日离职。


对上述信息,截至发稿前,腾讯官方暂无回应。


多名从业者对《智能涌现》表示,刘威已经在新加坡创业,瞄准的还是视频生成领域。


原腾讯AI Lab计算机视觉中心负责人、混元大模型技术负责人刘威。图源:腾讯AI实验室微信公众号


在腾讯,具有“杰出科学家头衔”的刘威,最为人所知的身份是腾讯混元大模型的技术负责人之一。


此前,他曾任腾讯广告多媒体AI中心总监,带领团队基于混元大模型,研发了广告多媒体AI技术矩阵,提高了腾讯的广告转化效果和广告制作效率。


种种迹象表明,在验证落地场景和商业模式前,腾讯对视频生成的投入还十分谨慎。


一名从业者表示,图像、音频是目前腾讯多模态研究的重点:“技术成熟,成本可控,而且比较容易找场景。”比如,2024年11月,微信公众号最新版本上线了“朗读音色”功能,用AI实现了音色克隆。


“在腾讯,目前CV研究的主力在混元团队。但总体而言,腾讯对视频生成的人力和资源投入还不是很大。”上述从业者表示。


另有相关人士表示,腾讯AI Lab计算机视觉中心所配备的人力向来很少,刘威创业后又带走了多名成员,“总体而言,AI Lab对视频生成很佛”。


有关是否大力投入视频生成模型,如今中国互联网公司已经分成了泾渭分明的两派:


大举投入派,以字节跳动和快手为代表。2024年6月,快手发布了效果轰动一时的“可灵AI”;同年9月,不甘人后的字节一口气发了两款视频生成模型:Seaweed和PixelDance。


这些公司的特点在于,具有丰富的视频数据资源,以及能立刻与视频生成技术相结合业务场景。


而另一暂缓投入派,如百度,则对目前视频模型的商业回报,持有较为消极的态度。


此前《智能涌现》曾独家报道,在2024年Q3总监会上,百度董事长兼CEO李彦宏明确表示,Sora这种视频生成的投入周期太长了,10年、20年都可能拿不到业务收益,那么无论多么火爆,百度都不去做。


而腾讯对视频生成模型的态度天平,还尚未明晰。在明确落地场景和商业化回报之前,“类Sora”的视频生成模型还不会成为腾讯高调挺进的领域。


文章来自于“36氪”,作者“周鑫雨”