《智能涌现》获悉,AI视频生成科技公司“鹿影科技(Avolution.ai)”此前已完成天使轮融资,由蓝驰创投和红点中国参与投资。与此同时,鹿影科技正在启动新一轮融资,所得资金将主要用于技术和产品投入,以及团队建设。
成立于2023年9月,鹿影科技将产品定位为动漫图像视频的AI创作与内容消费双边平台。三名联创,是均具有技术能力和商业化经验的海外名校毕业生:
CEO黄昭阳在香港中文大学取得了计算机博士学位,曾任商汤、NIVDIA研究员,也是Correspondence Model(对应模型)视频生成架构的首创者与Consistency Model(一致性模型)视频加速技术引领者。
COO兼CFO李倩为芝加哥大学金融政策硕士,曾任职于金浦投资、中国银河证券及百度金融。CTO王超奇,芝加哥大学计算机博士,曾任谷歌大脑研究院,其提出的高效大模型与稀疏训练研究方法GraSP,是该领域论文引用最高的研究成果之一。
视频生成赛道,已经涌入了一群明星玩家。就“大厂梯队”而言,快手发布了视频生成模型“可灵”,百度有UniVG,阿里则推出了可以根据轨迹生成视频的模型架构Tora。
明星创业公司的存在感也不低,MiniMax、智谱AI、生数科技、爱诗科技、Hidream等耳熟能详的公司,纷纷发布了“类Sora”的视频生成模型。
其他创业者还有什么机会?黄昭阳告诉《智能涌现》,想明白这个问题,鹿影科技才有入局的底气。
在他看来,找到机会,并且在短时间内先建立壁垒的方式,无外乎两种:第一,团队在单点技术上有独特的专利或者解决方案;第二,找到大厂和明星公司还未进入的市场,深度挖掘场景需求,并利用该技术落地专属的垂类服务能力。
在技术层面,鹿影科技团队在2022年首次提出了LCM(Latent Consistency Model,潜在一致性)的概念,并在2024年基于清华大学的LCM架构推出了图生视频模型Motion-I2V,以及开源了视频生成模型加速技术AnimateLCM。
黄昭阳对《智能涌现》介绍,目前主流的几种视频生成架构(Animatediff、DiT等)均在早期阶段,对生成模型的依赖性较高,但目前的水平不足以解决视频生成的长时和一致性难题。“比如Sora中放出的demo中,有一个用气球代替人脸的视频,就是一种可以掩盖一致性不足的讨巧做法。”他提到。
他认为,视频的本质是Correspondence,也就是“内容-运动轨迹”的动态对应关系。一旦能够对内容和运动的对应关系进行建模,就能确保视频元素在运动过程中的前后一致性以及多镜头一致性问题。在数据端,鹿影科技建立了全球最大的Correspondence Learning数据集。
就具体效果而言,在运动轨迹较复杂、视角变换的情况,鹿影的Motion-I2V图生视频模型在运动形态的模拟和元素的一致性上,比Pika、Gen-2等模型的效果更好,其开源的AnimateLCM更是成为了AI创作者社区主流的创作工具之一。
在产品层面,鹿影科技选择的切入口,是面向C端生产者的动漫视频生成平台。
目前,考虑到下游客户的付费能力,以及模型在一致性和可控性上的缺陷,视频生成平台往往选择场景更为聚焦的B端场景,比如广告、游戏、影视。
为了打出差异化,黄昭阳告诉《智能涌现》,鹿影科技选择的优先面向C端二次元创作者的动漫视频生成创作平台,而鹿影科技的核心技术也聚焦在视频生成一致性与视频加速来提供良好的用户体验。
一方面,用户对于动漫生成场景要求的不是真实视频的拟真感,因此不会产生“恐怖谷”心理,反而对画面内容的张力、画风与笔触的细腻程度、画面自由的自定义能力要求很高,这正是生成式视频的优势且有价值的落地场景。
另一方面,Bilibili的发展,以及当下Lofter和QQ在二次元群体中的广泛使用,证明了二次元创作具有广阔市场;而各类漫展在国内展出,也证明了二次元具有很强的消费性。据中研产业研究院估计,2024年,二次元市场规模已经高达1200亿元。
针对动漫创作者,2024年7月8日,鹿影科技上线了图片、视频创作平台YoYo。
YoYo提供了文生视频和图生视频两种动漫创作模式。在文生图模式下,平台背后的动画视频生成模型可以基于用户输入的文字Prompt,生成可供编辑调整的多个分镜,进而将分镜扩展为具有一致性的视频。
△YoYo国内用户生成的视频。图源:YoYo
不可否认的是,工具型平台想要提高并维持用户粘性,最重要的是建立可互动、可消费的社区,形成生态壁垒。
黄昭阳对《智能涌现》介绍,在早期,PGC(专业生产者)对社区风格和生态的建立有至关重要的作用。团队与十多名动漫领域的专业生产者已经达成了合作,后续将在社区上线高质量的AI动漫内容。
上线未满一个月,YoYo的创作转化率(指注册后使用工具的用户比例)就达到了95%,并且55%用户会持续在次周上线使用。
全球化,也是鹿影科技的布局业务重点。目前,YoYo的海外用户占比接近70%,其中日本用户占到了用户总规模的35%。
△YoYo海外用户生成的视频。图源:YoYo
黄昭阳认为,目前的平台还处在获客和规模化的1.0阶段,主要目标是建立市场的品牌认知,以及获得用户反馈。在2.0阶段,YoYo的重心将放在完善内容的市场化供给,并在平台探索剧本共创、AI续写等可消费的AI Native(AI原生)互动方式。在黄昭阳看来,这也是AI视频技术真正能迈向规模化的起点。
以下是投资人评价:
鹿影科技的创始团队作为AI native的视频生成的前沿技术团队,基于对市场需求的深刻理解,致力于解决动漫产业创作端优质供给不足的实际痛点,并快速将模型能力产品化,积累了高质量数据沉淀。我们也会持续关注在某些细分场景能快速闭环,持续构建数据壁垒,并能持续提供超出用户预期产品的AI应用团队。
生成赛道应用前景广阔,在众多技术探讨中被认为与世界模型引擎相关联。区别于赛道内众多参与者,鹿影科技团队另辟蹊径,以AI生成可消费内容为出发点,打造泛动漫领域视频生成产品,通过技术逐步推动商业性价比及商业可用性,加速AI在动漫领域的渗透落地,让更多的内容消费者可以低门槛的进行内容生产。我们期待鹿影科技在动漫领域贡献更多力量。
文章来源 “ 智能涌现 “,作者 ” 周鑫雨 “
【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。
项目地址:https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file
本地安装:https://www.deepbi.com/
【开源免费】airda(Air Data Agent)是面向数据分析的AI智能体,能够理解数据开发和数据分析需求、根据用户需要让数据可视化。
项目地址:https://github.com/hitsz-ids/airda
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0