ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
对话吴欣鸿:美图AI首先追求帮用户赚到钱,应用窗口期就2年
8208点击    2024-08-06 14:14

在生成式AI浪潮中,场景玩家是易于忽视的群体,但往往又是低调中率先吃到红利的那一个。


在海外,不论微软还是Adobe都是如此;在国内,美图(HK.1357)也在展现这样的趋势。


作为一家曾经爆款产品频出、“美图”被名词作动词使用的公司,美图在AI浪潮里正在展现全新的气象。


有模型,国内首批交出视频大模型,Sora横空出世后又率先拿出DiT架构升级更新;


有应用,仅今年影像节上,就有多达6款产品的发布;


有业绩,全球VIP用户数破千万,2023年单个AI应用营收破亿,靠AI实现规模化盈利。


……


但这些变化,都是最终结果之后的现象,AI究竟如何刷新美图?美图又希望在AI时代通往何处?都面临答疑解惑。


吴欣鸿——美图的创办者、现任董事长兼CEO,当仁不让。



在量子位的最新对话中,吴欣鸿确认了美图在AI机遇中的变化,也分享了AI落地实践中获得的认知。


他反复谈到美图在AI中的角色、定位,以及既是出发点也是最终归宿的目标:通过AI打造产品帮用户赚到钱。


在AI时代,“美图一下”或许会有新的内涵,代表着生产力、降本增效,以及用户通过美图赚到钱。


对话吴欣鸿


“美图一直都是一家应用公司,AI时代也是”


量子位:美图已经传递出了AI时代下的变化,但外界也在不断问:美图做AI的优势是什么?


吴欣鸿:首先美图一直以来都是一家应用公司,我们2008年发布第一版美图秀秀的时候还在PC应用的时代,很快进入到移动应用,到现在AI应用。


本质上美图还是一个以AI应用见长的公司。你能够在这些垂直场景落地,能够快速地变现。所以很多人会把美图拉到这个大模型公司去比,就是说你凭什么跟OpenAI比。我们本来也没有打算跟它比,包括国内很多新的大模型公司比,因为本质上不在一个维度上,因为大家各有所长。


量子位:但你们也自研了大模型?


吴欣鸿:美图自研大模型更多是为了让我们AI应用有更强的竞争力,比如说在效果上更极致的追求,包括跟产品的深度融合等等。所以这实际上是一个也不能说误解,可能很多人觉得美图凭什么,但我本来就是做应用,但整个时代在改变,从PC互联网、移动互联网到现在AI时代,总之我们只是说在每一个大的技术变革去把应用,把变现这些给做好。


很多人可能一提大模型就得是AGI,去做通用大模型,但实际上我们在做影像与设计赛道的垂直大模型。我们觉得通用大模型肯定是往AGI的目标去狂奔,未来可能会成为一个有着超级大脑的AI助手。


我们做垂直的,比如说做图像、视频生成以及应用,那未来跟通用大模型是一个协同关系,因为我们知道通用大模型它不可能把所有的能力训在一个模型里,意味着它有极高的训练和推理成本,而且在实际提供生成服务的时候,也会变得很慢。所以大概率它还是通用大模型去做类似于像大脑、中控,然后去调用社会资源,使用各种工具来完成任务。


量子位:很多定位应用和产品的公司,会选择不自研大模型,投入更小。


吴欣鸿:首先,如果有现成的API可用的话我们也会接入,我们是一个对合作保持极大开放度的公司。那么Sora没有开放API,其他国内的厂商,在自研之前也还没有开放,以及这些产品在可控性、成本等问题初期都需要优化。我们可能等不及,因为作为在AI应用特别是在影像,视频作为其中一个重要的分支,已经是有很多应用场景的公司,所以只能先自己做,但未来如果说有合适的,比如视频大模型的API,我们也会考虑接入。甚至于说,在一个产品里会提供包括自己,以及多个模型的选择,让用户有对比的权利。


包括Adobe其实它的PR视频编辑软件,之前就宣布了可能会接入像Runway、Pika,也包括Sora这些模型,其实作为一个应用或者说工具来说,我们对此是极度开放,只不过现在其没有我们就得自己做。

另外为什么要自研大模型?刚才说了效果,对产品的自信以及有很多底层的认知能够去支撑你这个产品的竞争力。因为其实在生成式AI时代,认知的深度还是蛮关键的。


量子位:只有自己去做了才知道里面的know-how?


吴欣鸿:如果自己不做到模型侧,你只是泛泛地用一些API,认知不一定会很深,你要吃过苦挨过打,才能逐步建立认知,从而提升你的竞争力。


“我们不用拿着锤子找钉子,AI应用窗口期就2年”


量子位:能率先拿出视频大模型,本身也是一种AI能力积累和竞争力的体现。


吴欣鸿:美图是一个应用的公司,但是这些应用很多是以AI为驱动的,所以我们中后台其实有一个能力非常强而且非常庞大的AI视觉团队,在人才能力上我们相信在国内一直是第一流的,只是以前并没有过多的曝光或者宣传本身AI能力。所以从做视频生成来讲,我们觉得是有能力做这个事。大家也看到国内一个团队前前后后也有人开始做出来了。我们现在走在正确的路上。无非是时间的问题,我们相信有能力做好。


量子位:有应用和场景,对AI人才也是一种用武之地的保证?


吴欣鸿:美图有很多非常好的应用,这跟需要AI公司不一定是一样。因为很多公司可能有锤子我去找钉子。但是我们已经是在那摆着了,用户有什么诉求我们需要达到一个什么效果,其实心里是有数只要把AI技术朝那个方向去努力,达到用户想要的结果。这都是迟早的事,我觉得这是第一点比较重要的。


第二,我们技术能力上在国内也是一流的。在国际上也会拿很多奖项,参加一些比赛,也不是很难地去拿到一些荣誉,所以说不管是横向比较还是纵向比较,其实团队信心还是比较足的,觉得我们是有能力把一些比较顶尖的AI技术,别人做到我们也能做到。


量子位:我其实最感兴趣还是开拍和MOKI,这好像给美图打开了一扇新窗户。像MOKI专门是给到视频创作者打造的AI短片工作流;而开拍则是带货口播场景,不到半小时,就能帮助农民制作带货视频。

吴欣鸿:是的,我们实际上是在探索AI视频大模型落地的几个路径。无论是开拍,还是MOKI,都算是我们给出的一个解题思路。


开拍去年推出后,一年时间其实还是成为同类产品的标杆。是因为它确实比较早去探索AI工作流,就是怎么去构建,如何把原本需要分散使用几个产品到现在一个产品就能解决所有的需求。



MOKI也是在我们做视频大模型训练和做各种AI短片的打样,发现一个很大的痛点,视频大模型生成的这些素材其实是没有办法一键成片或者故事成片。但是做成AI短片所需要具备的这些技术能力我们其实都是具备的,那为什么不串联成一个产品呢?


所以说,都是以这种AI工作流来解决不同的垂直场景的目前的一些痛点。



量子位:开拍这款产品,瞄准的颗粒度细到口播,这体现你们一直以来做产品做应用挖掘痛点和定义的能力。


吴欣鸿:是的,其实做应用本质上就是做服务,你要想如何把你的客户服务好,你要不断地获得他们的反馈。我们特别喜欢负反馈。就是用户的吐槽,他骂得越狠我们觉得越有价值,因为这样能帮我们去快速优化产品。


我们觉得,AI应用的窗口期应该也就两年,然后已经过去了一年。所以其实留给开发者的红利期不多了。窗口期逐渐结束,赛道逐渐饱和,饱和后其实大家就会去卷。刚刚您提到的各种体验,然后不断地去基于数据去迭代优化。现在总体来说还是处在一个相对粗放的野蛮生长的阶段。因为现在各个赛道的AI应用其实还远未饱和,所以大家现在先粗糙且快速去站位。


量子位:有一段时间我已经很难下载新应用了,最近因为AI,又重新下载很多去体验,似乎是一个新周期?


吴欣鸿:未来也会逐渐地优胜劣汰。因为现在AI应用很多人会从单点切入,但很容易被更强的产品,更大的公司去覆盖,可能这些产品或者公司也无意去打击,但确实是人家就自然就覆盖掉了。所以我们可能做这个AI应用确实要深扎一个行业,一个垂直的场景,把它做得极深,这个深包括你在垂直场景你的产品、技术确实要足够好,然后你的认知,因为你每天都花巨大的时间在上面,您的认知肯定要比别人要深,我觉得这个才有可能是在变成后续越来越白热化的竞争继续站稳脚跟,因为现在太多红利扑进来,但是他们不一定会结合自己的一些优势,可能会有很多追风的人,但不一定是真的优势。


量子位:更多还是追赶风口和热闹。


吴欣鸿:这个还是挺容易被冲击到的,所以我们现在边界感还是很强,我们影像与设计的赛道已经足够大了,我们甚至在这个赛道还要继续更垂直,更深,才能守住我们的阵地,否则的话一旦你心浮气躁,很容易去开疆拓土,被冲击到。


“能不能帮用户赚到钱,是做新产品的首要标准”


量子位:现在明确有不做或者说有边界感?


吴欣鸿:所以现在我们很强调能力的复用,比如说最底层的模型生成能力,包括中台能力,都要去复用在不同的产品里,避免每个产品需要做很多的定制式的开发。


我们在提炼产品的强共性,就是它有哪些能力,比如中台模块。我们也很注重规模效应,我们做这些投入一定是需要通过服务更大量的用户获得更好的收入,才能在竞争中具有一定的优势。因为任何行业卷到后面都是规模效应的竞争。


所以总结来看,我们是提炼强共性、底层技术和中台能力复用,在用户的收入和规模上要形成规模效应,结合刚才说的在行业在垂直的场景就是要扎得深。


这就是我们现在的边界感或者对未来竞争力的一个理解。


量子位:边界传递出稳定性,但同时也代表着可见的天花板,很多人更喜欢传递没有天花板。


吴欣鸿:我们是不喜欢画饼的公司,发布会上讲的美图设计室和开拍应用案例,都是义乌电商卖家和勒水村的村民带货,都很实在。我们不怕大家觉得LOW,因为这就是大众的需求。我们就是一个为大众打造产品并做好服务的公司,因为公司的价值观就是求真务实,爱拼能赢,所以呈现出来的就是我们内心想的。


现在我们思考要不要做一个产品,首先是能不能帮助用户赚到钱。这个是前提,帮用户赚到钱,他才会有付费意愿,我们才能赚到钱。说起来很现实,我觉得现在很多用户很迫切需要赚到钱,所以这个是我们在决定做一款产品的一个最基础的考量。


量子位:这和你们最早知名的美图秀秀、美拍会有不同,之前更多传递的是满足用户需求,甚至是互娱方面的需求,但现在都是生产力工具?


吴欣鸿:因为生成式AI天然离产业更近,比如美图云修帮助影楼赚钱,开拍帮助口播达人,美图设计室帮助小微的电商卖家,是帮他们实实在在地赚钱提效,确实能帮助行业去降本提效。


第二它是有服务成本的,当然现在很多都还是在云端,当然未来用这种端侧的算力可能会有效降低成本,但至少目前很多AI应用需要去通过订阅、单购来覆盖它的生成成本。


所以它天然就是适合做生产力工具,能帮行业降本提效,也能够通过订阅来覆盖这个成本。


生成式AI和生产力工具的结合也是必然的选择,你至少得让你整个商业模型能转起来,所谓的增长飞轮,你能够赚钱才能反哺在产研上的投入。说到产研投入,它也会更大,就像刚才提到大模型等等的这些或者说我们强中台的投入。


“告别爆款心态,生产力价值争的是滔滔不绝”


量子位:你觉得目前外界有公允地感知到你们AI正在给你们带来变化吗?美图上下都在被生成式AI被刷新。


吴欣鸿:说实话,公允这个事情不是靠我们整天去说。你们要客观地认识我,而是说真的做出很强的产品力,获得很好的用户和收入的增长,大家看到成绩后自然慢慢就会改变对你的观感。实际很多人对美图觉得,美图在AI时代应该被冲击得最严重的一家公司。


量子位:是吗?有人跟你那么说啊?


吴欣鸿:比如说苹果的AI亮相后,觉得以后苹果用户一句话,还需要你美图产品干吗呢?但这是一个深度问题,因为AI助手其实深度是有限的,链路是比较浅的。所以你要做深就能够有个互补的关系。


我们说AI Agent,它调用各种工具、各种能力来完成特定任务,而不是它自己什么都能搞定。所以我觉得这是需要全行业大家共同成长,用户在实际使用中,慢慢对AI建立一个相对客观的期望。


量子位:你认为会有那么一个时间点或者时期,大家会意识到美图的AI产品开始形成爆发?


吴欣鸿:我们选择在生成式AI时代去做生产力工具,就是一个长期主义的选择。因为生产力工具不是那么时尚,不是说天天就能成就爆款,然后一炮而红。但它确实是一个长期很有价值的事情,所以我们持续在上面沉淀能力,迭代产品。可能随着用户慢慢积累、产品力的提升,慢慢就会到一个越来越好的阶段。所以它不一定是说有一天真的彻底引爆、彻底改观,其实它就是一个所谓的流水不争先,争的是滔滔不绝。我们不一定这时候去抢,说我们是第一个。


像视频大模型,它在未来一年内的能力,说实话是会各家逐步拉齐,像图像大模型,一开始像Midjourney的效果遥遥领先,后面的能力就不会有太大差距了,关键还是应用如何落地、如何变现。所以我们就低调去把事情做好,可能不会刻意说我们行业要怎么样的领先性,其实这不重要。


量子位:现在心态很平和,美图有过高光,现在会有落差感吗?


吴欣鸿:不会,我现在心态很好。我们真的是想帮用户创造价值,我们认为,这是一个对的事情,但是一个相对漫长的事情。所以还是那句话,既然选择了在生成式AI时代做生产力工具,就要能忍受前期的一些持续的,就是相对漫长,要从以往的做C端产品、爆款的惯性思维里面跳出来。


因为本质上它是两个关系,我们现在就是找准行业、找准使用场景,找准目标用户群,不断地把这个产品力做强,把他们服务好。别的我们也不去,那么多的机会我们也不一定都要去做。我们把自己做好就好了。


所以无论是开拍、美图设计室,在这样的理念下。它都是发展得挺好的,用户收入增长都很快。这是价值,实实在在的价值。


文章来源于“量子位”,作者“关注前沿科技




关键词: 美图AI , AI绘图 , AI , AI工具 , AI应用
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI工作流

【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费)


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/(付费)

2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md