AI生成视频无疑是今年最火热的赛道之一,涌现了众多种子选手。然而,像Akool这样的全能选手却不多见。Akool提供包括虚拟人、视频翻译、视频生成、换脸等影视级效果生成一站式解决方案,覆盖了企业多重营销应用场景。
AKOOL创始人&CEO吕家俊,是人工智能领域的资深专家。他拥有伊利诺伊大学香槟分校的人工智能博士学位、斯坦福大学的访问研究员经历,以及哈佛商学院总裁班的学习背景,这些都为他的专业素养奠定了坚实的基础。他还深度参与过两家 B + 轮科技公司的早期运行,在生成式人工智能,尤其是人物的生成和处理有十年以上的研究经历。
吕家俊的职业生涯始于苹果和谷歌。在这些科技巨头任职期间,他认识到人工智能的巨大潜力,特别是在创新营销和广告创作领域的应用。他曾提到:“广告商用信息轰炸消费者,但广告没有给他们提供沉浸在品牌中的机会,只是将产品信息强加给观众,难以用户让沉浸其中,从而使整个广告和购物体验变得毫无乐趣可言。” 于是他便创立了 AKOOL, 寓意一个很 cool 的 AI 工具营销平台。
吕家俊表示他致力于AI领域,是另一种对空间的征服,“AKOOL正在开发的数字克隆技术可以帮助人们以数字化的形式保存自己的声音和形象,未来甚至克隆人们的思维与智慧,成为他们的智能载体。”
目前,Akool已发展成为一个跨国团队,拥有近50名成员,分布在3个国家、4个时区、8座城市。这个多元化的团队汇聚了全球顶尖企业的高管和顶级高校的产学研人员,为Akool的持续创新和发展提供了强大支持。
近期,非凡产研特别采访了AKOOL创始人吕家俊,请他分享了AI如何革新广告营销的实践与洞察。
以下是访谈精华:
Q:能否先介绍一下你们的核心优势?
吕家俊: Akool的核心优势在于先进的人脸AIGC编辑和生成技术,这使我们成为行业领军者之一。我们目前专注于为高端品牌客户提供定制化解决方案,满足他们精细的商业需求。但也有面向C端用户的服务。
我们坚信,自主研发是确保产品质量和创新的关键。因此,从算法的设计开发、数据的采集整理到技术的部署应用,都实现了全流程的自主掌控。在设计研发产品之初,我们就希望能做到业内顶尖水平,因此定价也比同类产品高出许多。我们的目标是打造业界 Top1的产品,无法达到这标准的产品功能,我们会不断优化,甚至直接淘汰。
在产品开发方面,我们特别注重对口型等关键技术的创新。对于市场上众多的技术路线,我们都进行了全面的探索和尝试。得益于我们在人脸技术领域的深厚学术积累,使我们对技术路径有着清晰的认识。经过一系列的实验和优化,我们自主研发了一套创新架构,能够生成更清晰、更高质量的模型。有相当丰富的行业Know- how积累。
此外,数据是技术创新的基石。我们通过自主采集、购买以及合作伙伴提供的方式,积累了大量高质量的数据资源,包括珍贵的电影及拍摄现场数据。这些数据资源的深度和广度,构成了我们技术优势的重要支撑。
技术方面,我们整个技术迭代速度也非常快,基本上两到六周时间,就有非常大的算法迭代。近期也会有两个新的模型上线。
Q:你们的产品能力非常齐全,您是如何定位Akool的?
吕家俊:我们目前通过研发一系列产品,寄希望将自己打造成“AI界的Adobe”,为企业用户提供AI内容生成平台服务。
Q: 现在团队是在国内还是国外,服务的哪类客户比较多?
吕家俊: 我们团队比较全球化,总部设在美国硅谷,国内办公室设在上海,同时我们在韩国首尔也有独立工作室,并在其他国家拥有部分员工。整体整体架构比较分散,遍布全球各地。
Q: 公司目前是怎么获客的?
吕家俊: 我们的获客方式是通过服务大客户,利用他们的资源和案例,吸引到更多新客户。当然,最重要的还是把产品做好。即使你有先发优势,较早进入这个领域,但最后比拼的还是产品力。只要产品做得好,在现在的媒介环境和市场条件下,获客、找用户都是水到渠成的事情。
Q: 现在是有一些标准的场景化解决方案,还是只是提供通用的产品给客户,让客户自己去摸索?
吕家俊: 我们目前提供的产品主要是标准化的,用户可以在此基础上生成自定义内容。由于我们主要的客户群体是头部国际化品牌的广告营销从业者,他们在专业领域都有很深的积累,因此他们会一同和我们探索各种创意应用。我们也非常乐于协助他们分享这些想法,以及与其进行共创。
当然我们也为有特殊需求的客户提供API接口,让用户在标准技术基座上自由搭建“积木”,实现个性化需求。
此外,我们也在开发垂直化解决方案,部分使用场景已经完成。当然,由于无法覆盖所有场景,因此主要聚焦于主流场景。例如,近期我们上线了一个个性化视频邮件解决方案,允许用户批量生成个性化视频,并将其整合进邮件和其他渠道中进行发送。
Q: 邮件更适合欧美营销场景,在为国内客户提供服务时,Akool是否有一些适配性的应用场景可以考虑?另外,客户要使用我们的产品,是否需要具备一定的数据基础?以及训练周期要多久?
吕家俊: 邮件确实比较偏向欧美风格,针对国内我们尝试过类似彩信的服务,但视频大小会受到限制。目前我们服务的国内客户还不太多,仍处于早期拓展阶段。
关于使用模型需要多少数据和如何训练的问题,我们实际上有两套模型,一套是已经预训练好的大模型,基本上任何人都可以直接使用,无需进行额外的定制化等处理。另外,我们也能为用户提供fine-tune(微调)服务,但这种基本上对数据的需求量也很少,训练几分钟视频仅需1-2个小时,就能实现很好的fine-tune(微调)效果。
Q: 营销场景强调创意和独特性,而AI在视觉呈现上较易普及,导致许多内容同质化。最近在戛纳创意节上,一位企业CMO指出,目前行业对优质AI创意的标准尚无共识。您如何看待这个问题?今天,AI创作内容的优质标准是什么?如何建立这样的标准?AI是否能为品牌创造出真正有价值的内容?如果能,应该如何实现?
吕家俊: 广告中有几个重要元素,其中创意和吸引眼球是关键。企业做的广告的主要目的是给人留下深刻的印象,而创意是实现这个目标的基础。然而,目前很难找到一个统一的标准来评价广告的好坏。
但我们可以用ROI来评价一支广告的实际表现。其是衡量广告效果的重要指标。成功的广告应该能够提升品牌记忆度并激发购买欲望。
在应对AIGC市场的同质化挑战中,我们采取了差异化的策略。与市面上多数针对C端用户、提供免费服务的AIGC工具不同,我们专注于商业应用领域,这注定会与免费工具区隔开。因此,我们的发展战略是向高端市场和企业客户扩展,旨在协助企业解决那些以往难以克服的挑战,并提供超越现有竞争者的独特服务和高附加值的解决方案。
在市场中定位我们的独特价值,我们观察到,成功的成熟企业往往不是依靠单一功能取得成功,而是通过构建综合性的产品来满足复杂多变的市场需求。在创意产业中,尽管存在一些长久流行的主题,但同时也有许多受限制的主题。尽管永恒主题不多,但经典内容依然被广泛采纳。同时,新的功能和趋势持续涌现,这要求我们不断地关注并适应这些变化。
另外,纵览整个行业生态,最终走向成功的公司,几乎没有仅靠单一产品功能就实现的。如果有,只能证明市场还不够饱和。在营销创意行业,永远固定不变的topic很少,要不断追逐全新的潮流趋势。
因此,在创意产业中实现盈利的关键在于,面向高端市场,专注于企业需求,并开发综合性的产品。这样才能持久活着并赚到钱。
Q:你们如何解决版权问题?假如一些用户,使用你们的工具生成一些不好的内容和人物形象之类的,怎么管理这种情况?
吕家俊: 在版权控制这一领域,当前确实存在不少混乱和争议。但AI创作工具的核心作用是辅助创作,而版权归属和相关责任主要由使用这些工具的创作者承担。尤其是涉及到二次创作时,通常都应该由创作者来确保其作品不侵犯他人的版权。
以Adobe的产品为例,用户可以利用其工具进行广泛的创作活动,但作品的版权归属和合法性责任归创作者所有。这一点在美国的一个经典案例中得到了体现,为什么工具提供方不必为用户使用工具时产生的版权问题或行为承担责任。这个逻辑是,如果工具提供方要为用户的使用行为负责,那么这将妨碍所有工具的正常运作和创新。
以微软的Word为例,如果有人使用Word撰写不当内容,责任应由使用者承担,而非微软。这一原则同样适用于我们的AI创作产品。我们的产品允许用户上传素材,并提供编辑功能,但用户必须确保他们提供的素材不侵犯版权,且使用这些素材的行为是合法的。
总的来说,AI创作工具提供创意和便利,但它们并应该不负责监管用户创作内容的版权问题。用户在使用这些工具时,需要自行确保对所使用的素材拥有合适的使用权或授权,避免侵犯他人的知识产权。
Q: 根据我们在国内的经验和感受,目前在国内AI领域,虽然有很多品牌都在尝试,但实际上能够拿出实际成果的品牌还是相对较少的,并且这些品牌大多保持着比较低调的姿态。您在美国观察到的情况是怎么样的?另外,您认为品牌营销人员现在对于AI,有哪些正确或错误的看法吗?
吕家俊: 许多知名品牌正处于探索人工智能应用的初期阶段,这反映出AI市场的庞大潜力。目前,大品牌对AI技术的采纳率可能还不足0.1%,即便如此,市场规模已经相当可观。可以预见,一旦有10%及以上的品牌开始采用AI工具,市场必定会迎来更大规模的扩展。
然而,品牌在使用AI工具时,会面临版权问题和公众舆论等多重考量,这使得它们在推进过程中持谨慎态度。我们相信,随着技术的不断发展和应用的普及,大家对AI的使用将会越来越普及,正如互联网和虚拟货币的发展轨迹一样,都会经历从最初的观望到后来的大众广泛参与的过程。
品牌对于自身形象的维护非常重视,因此它们倾向于选择更为稳妥的发展路径,需要确保任何新举措的安全性和可靠性,以避免可能的风险和责任归属问题。
但尽管如此,一些规模较小、更灵活的品牌可能会更快地采用AI技术,因为它们能够更快地适应市场变化并抓住机遇。
总体来看,品牌正在迅速适应AI技术,因为他们确实看到了AI带来的流量增长和明确的投资回报(ROI)。
Q: 营销人员和市场部门对AI取代他们的工作感到担忧,并可能有抗拒心理。个人如何适应AI?此外,企业也面临挑战,因为他们需要重新建立工作流程来适应新技术。您对此有何经验或看法?
吕家俊: 尽管很多AI工具功能卓越,但它们并不会取代人类的工作。因为即使工具再强大,但最终的成果仍需人类的监督和审查。在许多情况下,尤其是当任务标准提升至更高水平时,人工复审和参与变得尤为重要。
目前,大家面临的更紧迫的任务应该是学习掌握AI工具,探索如何有效利用它们来提升自己的工作效率。尤其在广告营销行业,AI技术的应用极大地降低了对个人专业能力的高门槛要求。如今,即便是专业技能水平不是非常高的从业者,也能借助AI工具高效地完成工作,这无疑是一大利好。AI的辅助它不仅提升了工作效率,还使得更多创意和营销工作能向更广泛的群体开放。
Q: 这样情况下,门槛可能会变低,但是天花板又高了,因为大家都用一样的工具。
吕家俊: 每个行业都在不断发展,大家都发展了之后,就会共同推动行业进步。这基本上就是一个类似于搜索引擎的竞价排名机制,大家相互竞争。如果大家都使用这个工具,而你不用,那你就可能会落后。
Q: 你们的产品能力会不会因为依赖于底层的大模型而受到影响,大模型的发展过程会限制产品的发展吗?您怎么看待这个问题?
吕家俊: 确实,各种AI大模型的发展,无论是在声音合成、文本生成,还是视频和图片处理等,都极大地丰富了我们为用户提供的体验效果。
然而,当前从技术到应用的最大gap仍然在于实现卓越的效果。特别是在营销广告领域,尽管品牌主存在各种担忧,但其最关心的依然是投资回报率(ROI)。尤其是从长远来看,体验和效果更是直接影响ROI效果。
而AI大模型的进展正为提升这些体验铺平道路。以语言模型为例,以前市面上有已经能够生成多样化的语言内容,但其在情感表达等方面与真人相比仍有差距,尚未达到完美的境界,如今新一代大模型取得突破性进展后,大大解决了这个困扰大家许久的问题,显著提升了用户的使用体验,也才使得其真正流行起来并得到广泛应用。
目前,许多产品仍处于可用与不可用的边缘状态,仍然需要大模型技术的进一步成熟和普及,才能加速落地并实现广泛应用。
Q: 对你们来说,除了上述的挑战之外,在发展过程中还有哪些困难?
吕家俊: 这个领域正以迅猛的速度演变和成长,新项目层出不穷,技术也在不断地推陈出新。在这样的快速发展中,我们的首要任务是精准定位并解决市场上真正的需求,这是至关重要的一步。如果项目选择不当,后续所有的努力都可能白费。因此,确保项目的选择与市场需求相匹配是成功的基石。
在项目确立之后,接下来的关键是保持快速迭代的能力,这不仅能够确保我们的产品技术始终走在行业前列,也能够持续提升客户体验。通过快速迭代,也才能够及时吸纳用户反馈,不断优化产品功能,从而增强客户的忠诚度。
增强客户粘性是维系客户关系、促进客户长期留存的关键。我们希望客户能够在我们平台上持续使用产品,并在此基础上探索更广泛的应用场景。这种持续的互动和使用将为我们带来宝贵的数据支持和市场洞察,进一步指导我们的产品开发和市场策略,形成一个良性的创新循环。
Q: 培养客户的这个过程需要很大的定力吧?尤其是一个新技术,或者新产品推出之后,需要花费大量精力教育并去培育客户。
吕家俊: 确实,市场教育往往伴随着较高的成本,尤其是当你推出了一个全新的产品首次进入市场时。在这种情况下,通常都需要投入大量的时间和资源来教育客户,让他们了解和接受你的产品。但如果你的产品具有高粘性,那么这种投入是值得的,因为你是在培养自己的忠实客户群体。如果你的产品粘性不足,就有很大可能面临为他人做嫁衣的风险。
幸运的是,我们所在的领域作出的成果直观可见,最终制作的视频等成品理解门槛也不高,用户可以迅速理解产品的价值和使用方式。这使得相较于其他领域,我们的市场教育成本相对较低。
当然,产品内部一些复杂的编辑生成应用,还是会有一些教育客户的成本。因此,我们采取的策略是避免一开始就投入大量资源进行客户教育。而是选择从简单易用的界面和功能入手,让用户能够快速上手,从而降低学习曲线。
随着用户对我们产品的基本功能产生信任和依赖,再逐步引导他们探索更高级的功能,以此提升用户粘性,并确保我们的客户教育工作能够带来长期的回报。通过这种方式,我们可以在控制成本的同时,有效地培养客户的忠诚度和产品的市场接受度。
Q: 您长期在美国,想请您分享一下关于中美两国AI创业环境以及整体发展情况的一些观察。
吕家俊: 我主要将精力集中在我们公司业务的发展上,因此并没有过多地关注其他领域的动态。鉴于我们的业务重点在于海外市场,我对国内的情况自然关注较少。总体而言,我认为在人工智能领域,中美两国的发展步伐基本上是同步的。从我的角度来看,两国都拥有广泛的企业参与,涵盖了各种规模和类型的企业。在产品开发和技术应用方面,两国也展现出了相当的水平和能力,并没有特别显著的差异。
Q: 在服务国外客户和国内客户过程中,有什么差异性的感受吗?
吕家俊: 我们公司的业务主要集中在海外市场,超过95%的客户来自国外。相较于国内客户,他们往往对定制化服务的需求较少。我们公司也主要提供标准化的产品,给予客户较大的自由选择和尝试空间,并不主动提供额外的协助。当然如果能够将服务国内客户的定制化流程和经验移植到海外市场,可能会为海外客户带来额外的价值,这可能成为我们公司的一大竞争优势。然而,目前看来,海外客户对定制化服务的需求相对较低,他们对标准化产品的接受度也相对较高。
另外,不同国家的客户有着各自的特点。例如,有些国家的客户在与销售团队接触时,可能已经做好了购买的决定,表现出非常明确的购买意向。而其他一些国家的客户可能需要更多的沟通和了解,即使经过长时间的交流,也不一定会做出购买决定。
文章来源于“非凡产研”,作者“AI商业智库”
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。
项目地址:https://github.com/InternLM/MindSearch
在线使用:https://mindsearch.openxlab.org.cn/
【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。
项目地址:https://github.com/miurla/morphic/tree/main
在线使用:https://www.morphic.sh/
【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。
项目地址:https://github.com/InternLM/xtuner