AI的风刮了两年,哪些产品胜出了?
两年前,ChatGPT爆火,掀起全球范围内的大模型开发热潮。国内大厂和创业公司纷纷入场,试图在AIGC时代占据一席之地。
如今,各家的产品都已铺开落地,和各行各业紧密结合。有数据显示,中国AI原生应用已经拥有了1.2亿月活跃用户。一大批已经习惯使用AI的人,率先享受到了技术红利。
我们好奇的是,AIGC的风刮了近两年后,到底哪些产品真正融入了用户日常?哪些是真需求,哪些是伪风口?
「定焦One」和多位用户交流后发现,在使用功能上,职场人士最常用AI查阅资料、编辑文档、翻译文本、公文写作、生成图片或视频;在行业上,内容创作、智能客服、营销以及有标准化(SOP)作业程序的场景,运用AI较多;至于具体的产品,在C端,文小言(原文心一言)、Kimi等讨论度更高,在B端,豆包、通义等常被创业者们提及。
不过,尽管AI产品众多,但功能上创新不够,用户活跃度、留存和商业化仍面临瓶颈。AIGC号称是下一代移动互联网级别的创新,却一直未能爆发,业内人士认为,未来能否出现杀手级别的应用,将会是各家决出胜负的关键。
企业职员璐璐平时主要做文稿编辑工作,她常用字节跳动的豆包和腾讯的元宝。最初使用大语言模型是为了完成工作中的一些形式主义的文件,她希望能提高效率,挤出更多时间去做更能提升自己能力的事情。
她发现,使用AI工具的效果很好,“有时候总觉得稿子里的某句话有语病,但我又拿不准,此时把这句话单独摘出来让AI帮忙校对和完善,比自己绞尽脑汁思考或者上网搜索别人的句子要高效得多。”
长期用下来,璐璐的感受是,文字方面,元宝要比豆包更接地气一点,人工智能感稍微弱点。但在作图方面,她更喜欢用豆包,可以有尺寸、风格的选择。
出版行业从业者张清常用AI产品做翻译、整理类工作,豆包、Kimi、通义等工具给她的工作带来的很大的方便。
她的整体感受是,这几个产品做翻译类、整理类、搜索类工作都比较智能。以翻译为例,将外语译成中文时,中短篇幅的文章能做到准确、语言通顺,也符合中国人的表达方式,但如果是长篇文章,能感受到是机翻。在中译英的时候,语法很准确,但是一个明显的问题是,AI不懂文化。
图源 / Unsplash
张清介绍,比如,中国人在邮件中寻求合作后,会问对方“意下如何,我们可以详细聊聊吗?”这在中文语境没啥毛病,就是一种礼貌的问询,对方可以回复也可以不回复。但是AI会翻译成“What's your opinion? Can we have a detailed talk?”在英文邮件语境里就会有一种强迫回复的意思,在初期寻求合作会显得很不礼貌。
文化行业从业者张瑞提到的“救星”,则是文小言。
她的工作比较繁杂,除了本职业务之外,经常要写方案、活动总结、学习心得等。她苦恼的是,这类型“杂活”已经严重影响到了她的本职工作。
比如举行消防演习、交通安全讲座、体育节、艺术节、读书节等活动,她所在的机构要求他们活动前出策划方案,活动后出宣传文案,还要交学习心得,日常还要写工作故事、读书笔记等,忙的时候,她几乎每天都有要写的材料,苦不堪言。
她认为大模型最方便的地方在于,定了主题,系统会把该主题下有用的资料都整合好,附有出处,生产的内容也有一定的逻辑。如果是要求比较低的总结和汇报材料,可以直接用,即便是要求高一点的,在AI的基础上做一些修改,也比自己写省事多了,和网络资源的重合率也比较低。
在AI的辅助下,她经常不到半小时就能完成一篇文案。据她所知,年轻的同事们大多都用AI辅助工作,领导对此表示默许。
AI帮人提升了工作效率,但是这样的操作也有隐忧,璐璐最担心隐私泄露的问题。
她提到,为了让AI写出更符合要求的内容,有的时候需要告诉AI很多前提,比如自己的身份、要做什么事情……从旁观者视角看,循着和AI对话的轨迹,很容易勾勒出提问者的画像。“这是我比较担心的,毕竟我不想让同事和领导知道我用了AI完成某些工作。”
AI产品在C端帮打工人提升效率,在B端则为创业者带来真金白银。
张格源是AI领域的创业者,他主做2B业务,为企业客户做AI数字营销和AI自动化解决方案。
据他介绍,AI数字营销的一项业务是数字人,“有几个客户在做创始人IP,我们通过数字人技术帮他生产大量内容;数字人还涉及到短剧出海,可以通过AI把短剧的声音、字幕、口型翻译成各种语言。”
AI数字营销的第二个业务是文生图。他介绍,“我们所在的云南属于热门文旅目的地,年轻游客的很大一项需求是拍照打卡,我们通过AI写真能做出一些有意思的照片,AI写真也是我们客户可利用的营销工具。”
AI自动化解决方案是张格源为客户本地化部署的大模型一体机(硬件+大模型软件配套一体的设备),对客户来说,采购这样的一体机,数据资产在自己手里,信息安全有保障。在一体机上,大模型可以将原本的人工业务如公文写作、内容审核等自动完成。
图源 / Unsplash
张格源提到,开发这几项业务,用到的工具主要是字节跳动旗下的豆包大模型,以及一站式智能体开发平台Coze(扣子)。
具体来说,Coze有丰富的插件生态以及工作流生态,大量用户在上面开发了bot,“我们基于这些bot,开发了一些MVP(最小化可行产品)级别的产品,再在不同渠道分发,比如交付部署到我们客户的微信公众号、抖音上面去做服务。”
他提到,涉及视频内容时,运用到的AI能力有数字人、语音识别(ASR)、文本转语音(TTS)等。基于剪映、即梦等AI平台能力,可以实现文案生成、文生图、AI音乐、AI视频等内容。
另外,他们常用到的还有百度智能云,它可以根据文本内容,完成视频的自动剪辑画面、配音、字幕等,最终输出成品视频。
这些AI产品的使用,极大地降低了创业的技术门槛。在花费上,张格源透露,他们一年在火山引擎上支付token的费用大概是几万元。
不过,技术进步的另一面是,AI生成的内容也可能被人利用,做一些涉嫌犯罪的事。前不久,“三只羊录音门”事件闹得沸沸扬扬,经相关部门调查后确认,网上流传的音视频为伪造,就是利用了AI声音克隆工具生成假音频,再用视频制作软件合成影像。而这一工具,原本是面向短视频制作者、景区导游解说、地铁语音播报等应用场景。
张格源提醒,AI生成的内容足以假乱真、瞒天过海,需要从业者们谨慎防范。
目前国内主要的AI应用,有百度(文小言)、字节跳动(豆包)、阿里(通义)、腾讯(元宝)等大厂的大模型产品,也有创业公司“AI六小龙”,业内公认的是月之暗面(Kimi)、零一万物(万知)、MiniMax(星野)、百川智能(百小应)、智谱AI(智谱清言)、阶跃星辰(跃问)六家。
「定焦One」和多位用户交流时,大家经常提到的产品包括豆包、文小言、Kimi等,结合近期“AI产品榜”发布的9月榜单,能更直观地看到哪些APP受到欢迎。
据“AI产品榜”统计,截至2024年9月,国内的AI应用已经有了1.2亿月活跃用户。 其中,国内总榜月活 (MAU) 排名前五的应用分别是 豆包、文小言、Kimi、天工AI、讯飞星火。
来源 / AI产品榜
在从业者眼中,市面上各家的AI产品表现各有千秋。
AI从业者致远分析,每款产品的优势都是背后的公司基因决定的,产品背靠的公司所能积累下来的数据,是AI能力的根本。
他解释,文小言依托百度的搜索资料库,在办公文档方面,比如整理资料、做汇报、写文案等工作,表现不错;有阿里系庞大的电商客户的数据,通义千问更擅长电商优惠策略的设计、营销文案撰写,在电商策划运营方式、电商的SEO上辅助商家,另外,围绕电商体系,在生成图片、生成视频方面也更擅长;Kimi在C端用户使用体验上反响比较好,字节系的产品在B端更加丰富。
总结来看,目前应用AI比较多的行业,包括内容领域、智能客服、市场营销等。
另外,带有标准化SOP的一些场景,也会有大量的AI和自动化的能力加持。张格源介绍,在农业领域AI也得到了应用,比如水果采摘以后,有企业做了智能检测的传送带,通过视觉AI去判断哪些水果是残次品,还有农业上的病虫害检测、鲜花的病虫害以及温湿度的监测都可以利用AI的能力。
10月份正好是高通骁龙旗舰芯片发布的时间,小米、vivo、OPPO、荣耀的旗舰手机也会随之发布,张格源预测,AI功能将会是手机厂商的重要抓手和卖点。小米的人、车、家全生态可以基于小爱大模型实现智能化万物互联。OV等厂商也在手机端侧实现给用户的AI辅助功能,例如通话内容总结等。
接下来伴随着手机的AI能力,也许可以实现这样的场景:“我跟客户聊到要去深圳拜访,手机里就能生成明天要去深圳的待办事项,备注目标公司的地址,还可以调动OTA产品去找最合适的机票、酒店。”张格源认为,类似的AI能力,可能是下一步手机厂商的竞争方向。
资深AI领域从业者连诗路认为,大模型应用前景广阔,但企业在获客、留存、商业化,技术发展上面临诸多挑战。
他对比了豆包、Kimi、文小言、讯飞星火、腾讯元宝等产品的留存率后发现,用户下载之后的30日内,使用率大部分都低于1%。而“AI产品榜”8月的数据显示,国内的AI应用,用户每个月平均只使用4.3天。连诗路认为,大语言模型有非常高的应用价值,只是目前的还没有做出杀手级的应用。
另外,今年以来,大模型企业因内卷而打起了价格战,商业化难题摆在了眼前。
最近几个月,字节、百度、阿里云、智谱AI等企业纷纷宣布降低大模型产品和服务的使用价格,不少大模型产品价格降幅达50%以上,有的产品价格降幅甚至超过90%。
连诗路估算,降价后1元钱大约可以买到200万字符,相当于5本《新华字典》的文字量。
有报道提到,今年5月以前,国内大模型推理算力毛利率高于60%,和国际同行基本一致,今年5月各大厂接连降价后,推测算力毛利率跌至负数。
关于“AI六小龙”,连诗路认为,它们受数据和算力限制,进一步拓展比较难。
不过,目前国内的AI发展产品增速和技术创新有减缓,但是产品形态和应用比较丰富和开放,AI的未来仍然可期。
他提到,AIGC上半场是算法工程人员引领团队做数据清洗、数据集、预训练、调优、做基础模型,下半场是要挖掘AIGC的应用场景。AIGC的杀手级应用不再局限于手机、智能家居、智能汽车某一类,而是可以和万物互联,他预测AIGC杀手级应用将在2026年前展现于市场。
文章来源于“定焦One”,作者“定焦One团队”
【开源免费】suno-api是一个使用监听技术实现了调用suno功能,并封装好API的AI音乐项目。
项目地址:https://github.com/gcui-art/suno-api
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】MockingBird是一个5秒钟即可克隆你的声音的AI项目。
项目地址:https://github.com/babysor/MockingBird
【开源免费】Fay开源数字人框架是一个AI数字人项目,该项目可以帮你实现“线上线下的数字人销售员”,
“一个人机交互的数字人助理”或者是一个一个可以自主决策、主动联系管理员的智能体数字人。
项目地址:https://github.com/xszyou/Fay
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。
项目地址:https://github.com/Henry-23/VideoChat
在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat
【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址:https://github.com/PeterH0323/Streamer-Sales