AI视频的落地,也走出了两种路线。
一边,以Sora为代表的文生视频Demo发布令世界震撼,新技术还在不断突破,产品落地还有段距离。
但另一边,第一波AIGC公司,已经凭借着视频生成工具,开始赚钱了。
来自魔珐,来自刚面世不久的AIGC一站式3D视频创作工具有言。
创始人兼CEO柴金祥教授自曝:产品上线不到两个月,已经过了PMF这个点。
(PMF指的是产品和市场达到最佳的契合点,你所提供的产品正好满足市场的需求,令客户满意)
而且不光是有第一桶金,更主要的是魔珐还跑通了3D视频创作的规模化商业化路径——
在这两个月里,有言已经成功服务了超过50家企业头部客户,覆盖各行各业,实现了技术和商用的闭环。
所以在这种盈利模式背后,到底有哪些值得借鉴的做法?
在官网的介绍中可以看到,有言是一个AIGC一站式3D视频生成平台,无论是个人还是企业用户都能使用,同时提供免费和付费版本。
从脚本文案开始,到3D人物的表情、动作、声音,再到3D视频的镜头、灯光都可以AIGC一键生成。用有言无需拍摄,就能完成多种场景所需的高质量的3D视频创作。
不过耳听为虚,有言到底有没有宣传得那么神奇,量子位进行了一番实测。
进入有言的工作台,点击新建作品,选择横屏还是竖屏,然后就可以开始写脚本了。
不会或者不想写的话也可以通过页面内的按钮让AI代劳,或者从中汲取一些思路。
“AI脚本”功能内置了产品种草、知识分享和大型活动三种场景,每个场景中又按照行业进行了更详细的分类。
用户可以根据自己的需求,选择相应的场景和产品属性,补充完基本信息后让AI创作视频脚本。
假如我们制作一段“土豆牌薯片”的推广视频,产品的卖点是“好吃”,预计1分钟时长,按照下图这样设置好这些信息后,很快视频文案就完成了。
把生成的文案复制到右侧的框中,再根据实际需要简单修改,就可以进入下一个环节了。
此外,有言也支持高级模式,用户可以输入任意提示词即可生成脚本。有言内置的AI优化功能,让用户无需为不知如何撰写提示词而苦恼。只需要输入想要表达的文案,借助AI优化后点击立即生成,即可完成脚本的创作。
第二步需要为视频选择背景、出场人物和配音音色,选项比较多,怕看花眼的话可以先根据应用场景进行初步筛选。
场景上,有十几种风格、多样化的背景和色系可供选择,排列组合起来就多达上百种,还能选择出场人物是站姿或坐姿;人物方面,也可以选择不同的性别、年龄、肤色和穿搭风格;声音上支持中英双语,同样有通用音色、电商主播、新闻播音员等不同风格可以选用。
如果有产品照片、PPT等素材,也是在这一环节中选择对应的片段来上传。
景别、运镜方式等细节默认由系统自动设置,如果需要手工调整,可以到“镜头优化”菜单中看一看。
这一切都搞定之后,点击界面右侧的“一键生成”按钮,视频预览就呼之欲出了。
不同景别交替错落,人物口型和文字内容完美贴合,还有自然的肢体动作,声音也没有什么机械感,听上去确实很有带货主播的感觉。
如果预览没什么问题,就可以进行渲染了,渲染完成后再加上BGM、字幕、片头片尾等包装,就可以导出视频了(也可以不包装直接导出),至此一段宣传片大功告成。
此外,有言还提供了海量的创作模板,只需修改文案和产品素材,就能快速得到一段高质量的宣传片。
这样来看,用有言来做视频,最大的特点就是低门槛、一站式全搞定。
不需要拍摄,最基本的流程就是输入一些信息然后点点点点点,简直不要太简便,没有视频剪辑经验的小编也很轻松地创作了一则作品。
而且可控可编辑,而有言的用户可以对生成视频的文案、角度、运镜方式等细节进行细致的调整和编辑。看市面上那些以文生视频为基础的产品,他们产出的视频也无法进行编辑,只能调整提示词然后重新来过,但结果往往是再次陷入不可控的过程。
还有就是高质量,可供商业化使用。有言拥有更加逼真和高质量的3D内容制作能力,而以Sora为代表的文生视频模型,却难以理解物理世界规律,在时空一致性、因果关系等方面依然面临着较大挑战。
另外在生成时长等方面,有言的3D视频生成也比文生视频具有显著优势,具体都在下面的表格中了。
价格方面,个人订阅是月付59元或年付598元,企业用户则根据规模、用户数量等因素有所不同。
不过柴金祥教授透露,有的企业用十万元购买了有言来制作视频,平均下来每分钟视频的成本只有几十元。
而在过去,用PGC的方式来制作一段这样的视频,成本高达数十万。如今AIGC生成的成本更低,效果却反而比过去还要好。
在实际落地应用过程中,有言已经在培训、金融、家电、旅游、教育等多个行业中的50多个头部客户实现了降本增效。
比如海尔集团就已经开设了100个账号,供横跨6大职能部门的400多名员工使用。
在不到两个月的时间里,有言一共给海尔集团制作了600余条、总时长3000分钟的视频,平均每天就有30多条视频产生,内容涵盖了内部培训到外部宣传的多种应用场景。
在使用有言之前,海尔集团制作一条视频,从拍摄到后期大约要花费三天时间,但现在这个时间缩短到了半天,节省了一半的成本。
以售后维修部门的内部培训为例,之前的培训内容主要以真人口述或图文形式呈现,拍摄制作视频的产出效率低、难以规模化,而这一问题最终被有言所解决。
有言商业化路径之所以能够跑通,除了本身的产品设计外,魔珐到底是怎么做到的?
魔珐创始人兼CEO柴金祥教授透露了三大关键原因。
首先,公司定位。即便外界AIGC进展频频的当下,柴教授仍给魔珐的定位是3D虚拟人公司。
魔珐科技刚成立时,本身作为三维计算机图形学和AI领域的世界顶级顶尖专家,柴教授就瞄准了3D领域,积累了丰富的3D数据资产。如今再回过头来看,这些高质量的3D数据,构成了区别于行业其他企业的核心壁垒。
当前,文生视频正在迎来关键的节点,对“物理世界的模拟器”已经成为业内共识的技术趋势。但要做到真正实现,其实还有很长的路要走。
首先需要解决的就是数据,更丰富多样、更多维度的信息表达成为大模型训练的关键。但2D视频随处可见,高质量的3D数据却很难获取。时至今日,它仍需要借助专业人员的手工制作,需要企业投入大量资金和时间成本创作。
而成立6年的魔珐,本身就已经具备了天然的优势。还有包括如今像VisionPro带火的空间计算,魔珐创作的内容可以直接适配。
第二,战略选择。魔珐选择彻底打通打透视频创作这个场景,实现AIGC Everything。
柴金祥将3D虚拟人当做一种内容形态,而且也是当前这个时代最容易被接受、且高效的一种形态。
对于企业来说,对外要连接他的客户,对内要连接他的员工、经销商。在直播、培训、招聘、宣传片等诸多场景中,企业都需要产出高质量的视频或者直播内容。
但传统的3D视频生产,企业需要构建一整个专业团队,包括模型师、动画师、灯光师、剪辑师等员工,要做好一个视频可能需要一两个月的时间。
这也跟每个人简单用手机端UGC工具进行视频创作也不一样,它无法满足企业端高质量视频、直播需求。
魔珐就聚焦企业端视频生产这个需求,推出了有言这款产品,从有言一站式AIGC视频创作平台可以看到,包括拍摄、剪辑到后期整套流程,灯光、动画、运镜和镜头全都可以AIGC一键生成,并且可控可编辑。
柴金祥透露,在接下来6、7月份会实现3D虚拟人的AIGC化,只需要上传一张照片,就能生成自己的3D虚拟人,并可对形象,造型,服装等进行编辑。
最后,技术与产业经验积累。魔珐现在拥有3D角色、3D动画、声音、镜头、文生文等在内的自研全栈AIGC技术,并且搭建了从超写实3D虚拟人工业化产线、3D虚拟人的AIGC平台到终端应用及行业解决方案的全链路产业架构。
因此对于怎样才能被称作一个好的AIGC产品,柴教授有自己的认知。
他认为从用户角度出发,“他才不关心你背后用什么技术”。具体以视频创作这个场景为例,他认为具备这四个特性:
高效率、高质量低成本、低门槛,以及AIGC产品一定具备的可控性、可编辑性。
看到当前正在火热的大模型,面对「是否有可能整个由大模型来驱动3D生成」这件事,柴金祥则是十分审慎的态度。
当真正做成产品化时,我不大认为真的能直接用一个大模型来生成所有视频的元素。
今天我们在产品也用了很多大模型技术,但如果去考虑可控性、可编辑性,我不认为今天这条单个大模型的路径一定是对的。
进入2024,大模型落地元年,即便当前各种前沿技术一个比一个惊艳,但需要思考的一个核心议题是:如何真正产品化并实现规模化商业化落地。尤其本身作为AIGC的公司而言,这是事关企业命运发展的关键拷问。
作为第一波AIGC公司来说,魔珐的「有言模式」无疑是给整个行业都打了个样——
基于多年的经验积累,以用户为重,打通3D视频创作这个场景,最终实现产品的规模化、商业化。
在与柴金祥的交流中,用户价值是其中谈及最多的关键词,也是有言产品化的秘诀所在。这个秘诀具象化就是高质量、高效率、低门槛、低成本。
正因为这种思路,有言在上线不到两个月,“就已经过了PMF这个点”。
也正因为这个思路,柴金祥教授提及,我们不探索Sora、Pika那种技术路径,我们跟他们不是一道的。
从商业化角度来看,以Sora为代表的AI视频生成,能够帮助用户去制作创意类的视频素材,但内容质量的不可控,难以满足企业或个人高效的信息传达场景的视频制作需求。
从文生文、文生图、文生视频内容,生成式AI阶跃式发展给内容创作带来了新的变革机遇。但要想真正融入各行各业,除了效果上的惊艳是远远不够的,高效可控低门槛的产品才能真正应用到普通人。
以往的实践证明,中国有着先天的场景和数据优势,最终能享受到技术红利,实现应用层面的全面开花。
移动互联网时代是,上一波AI浪潮也是,如今AIGC时代这样的趋势已经开始,以魔珐为代表的AIGC公司就是开始。
— 完 —
本文来自微信公众号“量子位”
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0
【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。
项目地址:https://github.com/Henry-23/VideoChat
在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat
【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址:https://github.com/PeterH0323/Streamer-Sales