自ChatGpt发布,全球又掀起一波AI创业浪潮,由AI衍生出的相关工具层出不穷,让艺术创作、广告、游戏制作领域效率提升数十倍。Sora于今年年初的发布,给视频领域带来全方面的震荡,世界仿佛是个巨大的模拟器,而Sora将成为其中解决视频生成问题的原点。
过去,虽然AI视频生成的产品不少,但是受制于技术难度和数据集等难题,并未出现类似文生图以及文本生成的大规模的应用。可控性、稳定性都是AI视频生成的硬伤。
Sora的发布,震动人心的地方在于视频领域的GPT时刻是否将因此来临,这其中蕴含着巨大的机会。毕竟,在ChatGPT的藤蔓上已经生长出不少相关的AI企业,布尔向量(BOOLV)便是其中之一。
成立两年的布尔向量,是一家主营AI视频生成的Saas服务企业,聚焦AI与数据挖掘技术,自动生成营销短视频。并以此为切入点,打造完整链路的全球短视频平台。早期的服务对象主要是服装类出海品牌和DTC品牌。
3月15日,布尔向量正式发布其SaaS产品——Boolvideo(体验地址:boolv.video),该产品主要面向海外品牌企业类客户,能够实现url、文字、图片等一键生成视频功能。
对于它的实际使用感受,我们上手体验了一番,并同「布尔向量」的创始人们聊了聊产品的开发思路。
在完成几步注册流程后,即能进入正式操作界面,选择想要的视频生成方式。
产品界面
以文字生成视频的方式来说,Boolvideo能够在数秒之内生成时长在数分钟内的视频,同时配有视频画面、字幕、配音和配乐,并自由选择想要输出的视频比例。
文字转视频
36氪发现,该产品对于电商用户比较友好,可以选择Shopify,亚马逊、Etsy 等平台独立站产品链接,产品会在读取链接商品后生成相关视频。
url链接转视频
并且,Boolvideo生成视频后,口播视频能够支持转换多国语言。
支持多种语言
Boolvideo配有编辑功能,左边分门别类有素材库,可以对视频进行进一步编辑;右边提供AI Assiatan功能,帮助用户生成一些文案类创意信息。
编辑器
Boolvideo也推出不少AI 小工具,能够去背景,文生图,让图动起来和AI改图。
其他工具
在自测使用感方面,Boolvideo上手容易,编辑器的存在使得输出的视频更有余地调整。不过,以文字转视频功能而言,视频画面同字幕匹配程度需要用户进一步的调整和磨合。
36氪了解到,Boolvideo的收费模式以月订阅模式,不同价格区间提供不同的服务。
订阅价格
文字转视频
36氪发现,该产品对于电商用户比较友好,可以选择Shopify,亚马逊、Etsy 等平台独立站产品链接,产品会在读取链接商品后生成相关视频。
url链接转视频
并且,Boolvideo生成视频后,口播视频能够支持转换多国语言。
支持多种语言
Boolvideo配有编辑功能,左边分门别类有素材库,可以对视频进行进一步编辑;右边提供AI Assiatan功能,帮助用户生成一些文案类创意信息。
编辑器
Boolvideo也推出不少AI 小工具,能够去背景,文生图,让图动起来和AI改图。
其他工具
在自测使用感方面,Boolvideo上手容易,编辑器的存在使得输出的视频更有余地调整。不过,以文字转视频功能而言,视频画面同字幕匹配程度需要用户进一步的调整和磨合。
36氪了解到,Boolvideo的收费模式以月订阅模式,不同价格区间提供不同的服务。
订阅价格
不同于不少AI视频生成产品面向C端的特性,布尔向量成立初期锚定的是品牌企业的短视频营销需求。
观看短视频在当下已不仅只是娱乐,甚至已是生活方式,获得新闻信息、看短剧、了解身边事、明星八卦、热门段子几乎都能在短视频中获得。TikTok在全球范围内的火热也已表明短视频席卷的不只是中国。
与此同时,广告营销方式已被改变,不再只是简单的图文、电视广告等传统的营销方式,短视频营销需求愈发旺盛。
布尔向量推出Boolvideo,看重的即是海外企业在短视频营销方面的潜在需求,目前面向的是小型企业客户、自媒体、内容创作者的品牌运营需求。
Boolvideo 设计体验总负责人 Kin 告诉36氪:“ 最初的产品设计构思,是来自对海外的内容创作者或者是中小型品牌企业的痛点输入和问题观察,海外用人力制作短视频的成本很高,聘请专业视频团队、找设计师都非常昂贵, 加上还有大量的沟通成本,最后输出的视频效果、生产效率都远无法达到视频每日更新要求。”
市场需求客观存在的同时,面向B端市场的AI视频生成也是布尔向量更为擅长、竞争不会太过激烈的细分领域。
布尔向量的技术负责人朱晗认为:“C端的短视频创作最能体现的是人的创意,创意的权重非常高,算法很难实现这点。而B端的视频创作,通过训练和观察能找到一定的规律,例如商品如何展示更好,在其中找到逻辑和审美赋予给AI。”
例如,在过服务电商客户的过程中,布尔向量解构了不少数据表现好的视频,发现视频审美好的视频ROI(投入产出比)指标会表现不错。因此,公司同广州美术学院合作,制作了不少针对各类场景、有艺术气息的视频template(视频模版),使用中获得不错的表现。
在布尔向量创始人王庆看来,营销视频生成不是完全技术驱动的东西,它要综合商业、视觉、审美,叠加AI技术,最终转化为视频实际效果。营销视频对于不同品牌而言,有不同的调性和要求。公司采用的方式是让某一个细分场景效果更好,训练自己数据的同时做细节的模型调优。在不同品类做细分拆解,抽象出通用化的品牌关键词、脚本能力,包括视频、审美等相关能力,让其变得可复用性更高。
除此之外,大量生成视频且保持视频的独特性,对于要实现商业化落地AI视频生成公司亦是关键。
布尔向量产品负责人Jerry认为,视频的表现是多维度的,有画面、音乐和字幕,包括滤镜特效和贴纸等各式各样的组合。“在保证基本生成规则的基础上,不断增加排列组合的多样性,控制好重复度,让用户始终觉得生成的是新视频。我们一直在往这个方向发展。”
回到实际应用层面,AI视频生成的视频对于企业客户而言,往往难以一次生成就满足其要求,绝大多数AI视频生成产品难以对视频再做修改,解决方法多是生成多个视频。而视频编辑类软件往往也只专注于其编辑功能。
Jerry告诉36氪:“AI视频生成和视频编辑软件单做两块是比较简单的,很少企业都做是因为在最初只做了某一个功能,如果将两种功能糅合在一起,需要调整底层数据结构、技术结构,保证兼容性。”
布尔向量花费近一年时间,将产品做大的改版调整,加入编辑器功能,据公司介绍,Boolvideo是目前唯一一个把AI生成视频和编辑器融链路融合在一起的产品。
“编辑器的功能能够帮助我们了解到视频生成产品存在的不足。比如,音乐素材被更换,是不是说明我们提供的音乐没有满足客户的需求。我们能基于这部分的数据训练模型和调整算法。”Jerry表示。
此外,考虑到视频编辑器的学习成本,Boolvideo采用的是主流视频编辑器界面,让其容易使用,并对编辑器中的素材做AI方面的处理,增效效果等功能。
事实上,花费两年时间让Boolvideo实现商业化落地,服务的客户从以服装品类为主的头部跨境电商扩展至全品类的企业客户,这是布尔向量创始团队在初期没有预料到的速度。
幸运的遇到ChatGpt的发布,无意助推了布尔向量的商业化速度,解放了公司在技术基建上的投入。在公司创始人王庆看来,对创业公司来讲,最合理的方式就是用最好的大模型、基于自己的需求做模型训练、深化做自己最擅长的领域。
基于此,之后Sora 正式发布,布尔向量团队也计划成为第一批接入Sora的saas工具。布尔向量也在近期又完成了一轮融资。
本文章来源于「张子怡Leslie」原创出品,作者 张子怡
【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址:https://github.com/microsoft/graphrag
【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。
项目地址:https://github.com/langgenius/dify
【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。
项目地址:https://github.com/infiniflow/ragflow/tree/main
【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目
项目地址:https://github.com/phidatahq/phidata
【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。
项目地址:https://github.com/TaskingAI/TaskingAI