ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
人工几十万,AI几十块!国产玩家证明了AIGC视频商业化威力
2300点击    2024-04-29 11:07

AI视频的落地,也走出了两种路线。


一边,以Sora为代表的文生视频Demo发布令世界震撼,新技术还在不断突破,产品落地还有段距离。


但另一边,第一波AIGC公司,已经凭借着视频生成工具,开始赚钱了。


来自魔珐,来自刚面世不久的AIGC一站式3D视频创作工具有言


创始人兼CEO柴金祥教授自曝:产品上线不到两个月,已经过了PMF这个点


(PMF指的是产品和市场达到最佳的契合点,你所提供的产品正好满足市场的需求,令客户满意)


而且不光是有第一桶金,更主要的是魔珐还跑通了3D视频创作的规模化商业化路径——


在这两个月里,有言已经成功服务了超过50家企业头部客户,覆盖各行各业,实现了技术和商用的闭环。


所以在这种盈利模式背后,到底有哪些值得借鉴的做法?


有言模式


在官网的介绍中可以看到,有言是一个AIGC一站式3D视频生成平台,无论是个人还是企业用户都能使用,同时提供免费和付费版本。


从脚本文案开始,到3D人物的表情、动作、声音,再到3D视频的镜头、灯光都可以AIGC一键生成。用有言无需拍摄,就能完成多种场景所需的高质量的3D视频创作。


不过耳听为虚,有言到底有没有宣传得那么神奇,量子位进行了一番实测。



进入有言的工作台,点击新建作品,选择横屏还是竖屏,然后就可以开始写脚本了。


不会或者不想写的话也可以通过页面内的按钮让AI代劳,或者从中汲取一些思路。


“AI脚本”功能内置了产品种草、知识分享和大型活动三种场景,每个场景中又按照行业进行了更详细的分类。


用户可以根据自己的需求,选择相应的场景和产品属性,补充完基本信息后让AI创作视频脚本。


假如我们制作一段“土豆牌薯片”的推广视频,产品的卖点是“好吃”,预计1分钟时长,按照下图这样设置好这些信息后,很快视频文案就完成了。


把生成的文案复制到右侧的框中,再根据实际需要简单修改,就可以进入下一个环节了。



此外,有言也支持高级模式,用户可以输入任意提示词即可生成脚本。有言内置的AI优化功能,让用户无需为不知如何撰写提示词而苦恼。只需要输入想要表达的文案,借助AI优化后点击立即生成,即可完成脚本的创作。


第二步需要为视频选择背景、出场人物和配音音色,选项比较多,怕看花眼的话可以先根据应用场景进行初步筛选。


场景上,有十几种风格、多样化的背景和色系可供选择,排列组合起来就多达上百种,还能选择出场人物是站姿或坐姿;人物方面,也可以选择不同的性别、年龄、肤色和穿搭风格;声音上支持中英双语,同样有通用音色、电商主播、新闻播音员等不同风格可以选用。



如果有产品照片、PPT等素材,也是在这一环节中选择对应的片段来上传。


景别、运镜方式等细节默认由系统自动设置,如果需要手工调整,可以到“镜头优化”菜单中看一看。


这一切都搞定之后,点击界面右侧的“一键生成”按钮,视频预览就呼之欲出了。



不同景别交替错落,人物口型和文字内容完美贴合,还有自然的肢体动作,声音也没有什么机械感,听上去确实很有带货主播的感觉。


如果预览没什么问题,就可以进行渲染了,渲染完成后再加上BGM、字幕、片头片尾等包装,就可以导出视频了(也可以不包装直接导出),至此一段宣传片大功告成。


此外,有言还提供了海量的创作模板,只需修改文案和产品素材,就能快速得到一段高质量的宣传片。



这样来看,用有言来做视频,最大的特点就是低门槛、一站式全搞定。


不需要拍摄,最基本的流程就是输入一些信息然后点点点点点,简直不要太简便,没有视频剪辑经验的小编也很轻松地创作了一则作品。


而且可控可编辑,而有言的用户可以对生成视频的文案、角度、运镜方式等细节进行细致的调整和编辑。看市面上那些以文生视频为基础的产品,他们产出的视频也无法进行编辑,只能调整提示词然后重新来过,但结果往往是再次陷入不可控的过程。


还有就是高质量,可供商业化使用。有言拥有更加逼真和高质量的3D内容制作能力,而以Sora为代表的文生视频模型,却难以理解物理世界规律,在时空一致性、因果关系等方面依然面临着较大挑战。


另外在生成时长等方面,有言的3D视频生成也比文生视频具有显著优势,具体都在下面的表格中了。



价格方面,个人订阅是月付59元或年付598元,企业用户则根据规模、用户数量等因素有所不同。


不过柴金祥教授透露,有的企业用十万元购买了有言来制作视频,平均下来每分钟视频的成本只有几十元


而在过去,用PGC的方式来制作一段这样的视频,成本高达数十万。如今AIGC生成的成本更低,效果却反而比过去还要好。



在实际落地应用过程中,有言已经在培训、金融、家电、旅游、教育等多个行业中的50多个头部客户实现了降本增效。


比如海尔集团就已经开设了100个账号,供横跨6大职能部门的400多名员工使用。


在不到两个月的时间里,有言一共给海尔集团制作了600余条、总时长3000分钟的视频,平均每天就有30多条视频产生,内容涵盖了内部培训到外部宣传的多种应用场景。


在使用有言之前,海尔集团制作一条视频,从拍摄到后期大约要花费三天时间,但现在这个时间缩短到了半天,节省了一半的成本。


以售后维修部门的内部培训为例,之前的培训内容主要以真人口述或图文形式呈现,拍摄制作视频的产出效率低、难以规模化,而这一问题最终被有言所解决。


魔珐秘诀


有言商业化路径之所以能够跑通,除了本身的产品设计外,魔珐到底是怎么做到的?


魔珐创始人兼CEO柴金祥教授透露了三大关键原因。


首先,公司定位。即便外界AIGC进展频频的当下,柴教授仍给魔珐的定位是3D虚拟人公司。


魔珐科技刚成立时,本身作为三维计算机图形学和AI领域的世界顶级顶尖专家,柴教授就瞄准了3D领域,积累了丰富的3D数据资产。如今再回过头来看,这些高质量的3D数据,构成了区别于行业其他企业的核心壁垒。


当前,文生视频正在迎来关键的节点,对“物理世界的模拟器”已经成为业内共识的技术趋势。但要做到真正实现,其实还有很长的路要走。


首先需要解决的就是数据,更丰富多样、更多维度的信息表达成为大模型训练的关键。但2D视频随处可见,高质量的3D数据却很难获取。时至今日,它仍需要借助专业人员的手工制作,需要企业投入大量资金和时间成本创作。


而成立6年的魔珐,本身就已经具备了天然的优势。还有包括如今像VisionPro带火的空间计算,魔珐创作的内容可以直接适配。


第二,战略选择。魔珐选择彻底打通打透视频创作这个场景,实现AIGC Everything


柴金祥将3D虚拟人当做一种内容形态,而且也是当前这个时代最容易被接受、且高效的一种形态。


对于企业来说,对外要连接他的客户,对内要连接他的员工、经销商。在直播、培训、招聘、宣传片等诸多场景中,企业都需要产出高质量的视频或者直播内容。


但传统的3D视频生产,企业需要构建一整个专业团队,包括模型师、动画师、灯光师、剪辑师等员工,要做好一个视频可能需要一两个月的时间。


这也跟每个人简单用手机端UGC工具进行视频创作也不一样,它无法满足企业端高质量视频、直播需求。


魔珐就聚焦企业端视频生产这个需求,推出了有言这款产品,从有言一站式AIGC视频创作平台可以看到,包括拍摄、剪辑到后期整套流程,灯光、动画、运镜和镜头全都可以AIGC一键生成,并且可控可编辑。


柴金祥透露,在接下来6、7月份会实现3D虚拟人的AIGC化,只需要上传一张照片,就能生成自己的3D虚拟人,并可对形象,造型,服装等进行编辑。


最后,技术与产业经验积累。魔珐现在拥有3D角色、3D动画、声音、镜头、文生文等在内的自研全栈AIGC技术,并且搭建了从超写实3D虚拟人工业化产线、3D虚拟人的AIGC平台到终端应用及行业解决方案的全链路产业架构。


因此对于怎样才能被称作一个好的AIGC产品,柴教授有自己的认知。


他认为从用户角度出发,“他才不关心你背后用什么技术”。具体以视频创作这个场景为例,他认为具备这四个特性:


高效率、高质量低成本、低门槛,以及AIGC产品一定具备的可控性、可编辑性。


看到当前正在火热的大模型,面对「是否有可能整个由大模型来驱动3D生成」这件事,柴金祥则是十分审慎的态度。


当真正做成产品化时,我不大认为真的能直接用一个大模型来生成所有视频的元素。
今天我们在产品也用了很多大模型技术,但如果去考虑可控性、可编辑性,我不认为今天这条单个大模型的路径一定是对的。


中国AIGC企业闯出一条新路


进入2024,大模型落地元年,即便当前各种前沿技术一个比一个惊艳,但需要思考的一个核心议题是:如何真正产品化并实现规模化商业化落地。尤其本身作为AIGC的公司而言,这是事关企业命运发展的关键拷问。


作为第一波AIGC公司来说,魔珐的「有言模式」无疑是给整个行业都打了个样——


基于多年的经验积累,以用户为重,打通3D视频创作这个场景,最终实现产品的规模化、商业化。


在与柴金祥的交流中,用户价值是其中谈及最多的关键词,也是有言产品化的秘诀所在。这个秘诀具象化就是高质量、高效率、低门槛、低成本。


正因为这种思路,有言在上线不到两个月,“就已经过了PMF这个点”。


也正因为这个思路,柴金祥教授提及,我们不探索Sora、Pika那种技术路径,我们跟他们不是一道的。


从商业化角度来看,以Sora为代表的AI视频生成,能够帮助用户去制作创意类的视频素材,但内容质量的不可控,难以满足企业或个人高效的信息传达场景的视频制作需求。


从文生文、文生图、文生视频内容,生成式AI阶跃式发展给内容创作带来了新的变革机遇。但要想真正融入各行各业,除了效果上的惊艳是远远不够的,高效可控低门槛的产品才能真正应用到普通人。


以往的实践证明,中国有着先天的场景和数据优势,最终能享受到技术红利,实现应用层面的全面开花。


移动互联网时代是,上一波AI浪潮也是,如今AIGC时代这样的趋势已经开始,以魔珐为代表的AIGC公司就是开始。


—  —


本文来自微信公众号“量子位”



关键词: AIGC , sora , AI视频 , AIGC视频
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0

2
无人直播

【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。

项目地址:https://github.com/Henry-23/VideoChat

在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat


【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。

项目地址:https://github.com/PeterH0323/Streamer-Sales