ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
哪些AI产品,真的有人在用?
7005点击    2024-10-10 18:40

AI的风刮了两年,哪些产品胜出了?


两年前,ChatGPT爆火,掀起全球范围内的大模型开发热潮。国内大厂和创业公司纷纷入场,试图在AIGC时代占据一席之地。 


如今,各家的产品都已铺开落地,和各行各业紧密结合。有数据显示,中国AI原生应用已经拥有了1.2亿月活跃用户。一大批已经习惯使用AI的人,率先享受到了技术红利。 


我们好奇的是,AIGC的风刮了近两年后,到底哪些产品真正融入了用户日常?哪些是真需求,哪些是伪风口?


「定焦One」和多位用户交流后发现,在使用功能上,职场人士最常用AI查阅资料、编辑文档、翻译文本、公文写作、生成图片或视频;在行业上,内容创作、智能客服、营销以及有标准化(SOP)作业程序的场景,运用AI较多;至于具体的产品,在C端,文小言(原文心一言)、Kimi等讨论度更高,在B端,豆包、通义等常被创业者们提及。 


不过,尽管AI产品众多,但功能上创新不够,用户活跃度、留存和商业化仍面临瓶颈。AIGC号称是下一代移动互联网级别的创新,却一直未能爆发,业内人士认为,未来能否出现杀手级别的应用,将会是各家决出胜负的关键。


01 打工人的“救星”


企业职员璐璐平时主要做文稿编辑工作,她常用字节跳动的豆包和腾讯的元宝。最初使用大语言模型是为了完成工作中的一些形式主义的文件,她希望能提高效率,挤出更多时间去做更能提升自己能力的事情。 


她发现,使用AI工具的效果很好,“有时候总觉得稿子里的某句话有语病,但我又拿不准,此时把这句话单独摘出来让AI帮忙校对和完善,比自己绞尽脑汁思考或者上网搜索别人的句子要高效得多。” 


长期用下来,璐璐的感受是,文字方面,元宝要比豆包更接地气一点,人工智能感稍微弱点。但在作图方面,她更喜欢用豆包,可以有尺寸、风格的选择。 


出版行业从业者张清常用AI产品做翻译、整理类工作,豆包、Kimi、通义等工具给她的工作带来的很大的方便。 


她的整体感受是,这几个产品做翻译类、整理类、搜索类工作都比较智能。以翻译为例,将外语译成中文时,中短篇幅的文章能做到准确、语言通顺,也符合中国人的表达方式,但如果是长篇文章,能感受到是机翻。在中译英的时候,语法很准确,但是一个明显的问题是,AI不懂文化。



图源 / Unsplash 


张清介绍,比如,中国人在邮件中寻求合作后,会问对方“意下如何,我们可以详细聊聊吗?”这在中文语境没啥毛病,就是一种礼貌的问询,对方可以回复也可以不回复。但是AI会翻译成“What's your opinion? Can we have a detailed talk?”在英文邮件语境里就会有一种强迫回复的意思,在初期寻求合作会显得很不礼貌。 


文化行业从业者张瑞提到的“救星”,则是文小言。 


她的工作比较繁杂,除了本职业务之外,经常要写方案、活动总结、学习心得等。她苦恼的是,这类型“杂活”已经严重影响到了她的本职工作。 


比如举行消防演习、交通安全讲座、体育节、艺术节、读书节等活动,她所在的机构要求他们活动前出策划方案,活动后出宣传文案,还要交学习心得,日常还要写工作故事、读书笔记等,忙的时候,她几乎每天都有要写的材料,苦不堪言。 


她认为大模型最方便的地方在于,定了主题,系统会把该主题下有用的资料都整合好,附有出处,生产的内容也有一定的逻辑。如果是要求比较低的总结和汇报材料,可以直接用,即便是要求高一点的,在AI的基础上做一些修改,也比自己写省事多了,和网络资源的重合率也比较低。 


在AI的辅助下,她经常不到半小时就能完成一篇文案。据她所知,年轻的同事们大多都用AI辅助工作,领导对此表示默许。 


AI帮人提升了工作效率,但是这样的操作也有隐忧,璐璐最担心隐私泄露的问题。


她提到,为了让AI写出更符合要求的内容,有的时候需要告诉AI很多前提,比如自己的身份、要做什么事情……从旁观者视角看,循着和AI对话的轨迹,很容易勾勒出提问者的画像。“这是我比较担心的,毕竟我不想让同事和领导知道我用了AI完成某些工作。”


02 创业者的掘金工具


AI产品在C端帮打工人提升效率,在B端则为创业者带来真金白银。 


张格源是AI领域的创业者,他主做2B业务,为企业客户做AI数字营销和AI自动化解决方案。 


据他介绍,AI数字营销的一项业务是数字人,“有几个客户在做创始人IP,我们通过数字人技术帮他生产大量内容;数字人还涉及到短剧出海,可以通过AI把短剧的声音、字幕、口型翻译成各种语言。” 


AI数字营销的第二个业务是文生图。他介绍,“我们所在的云南属于热门文旅目的地,年轻游客的很大一项需求是拍照打卡,我们通过AI写真能做出一些有意思的照片,AI写真也是我们客户可利用的营销工具。” 


AI自动化解决方案是张格源为客户本地化部署的大模型一体机(硬件+大模型软件配套一体的设备),对客户来说,采购这样的一体机,数据资产在自己手里,信息安全有保障。在一体机上,大模型可以将原本的人工业务如公文写作、内容审核等自动完成。 



图源 / Unsplash 


张格源提到,开发这几项业务,用到的工具主要是字节跳动旗下的豆包大模型,以及一站式智能体开发平台Coze(扣子)。 


具体来说,Coze有丰富的插件生态以及工作流生态,大量用户在上面开发了bot,“我们基于这些bot,开发了一些MVP(最小化可行产品)级别的产品,再在不同渠道分发,比如交付部署到我们客户的微信公众号、抖音上面去做服务。” 


他提到,涉及视频内容时,运用到的AI能力有数字人、语音识别(ASR)、文本转语音(TTS)等。基于剪映、即梦等AI平台能力,可以实现文案生成、文生图、AI音乐、AI视频等内容。 


另外,他们常用到的还有百度智能云,它可以根据文本内容,完成视频的自动剪辑画面、配音、字幕等,最终输出成品视频。 


这些AI产品的使用,极大地降低了创业的技术门槛。在花费上,张格源透露,他们一年在火山引擎上支付token的费用大概是几万元。 


不过,技术进步的另一面是,AI生成的内容也可能被人利用,做一些涉嫌犯罪的事。前不久,“三只羊录音门”事件闹得沸沸扬扬,经相关部门调查后确认,网上流传的音视频为伪造,就是利用了AI声音克隆工具生成假音频,再用视频制作软件合成影像。而这一工具,原本是面向短视频制作者、景区导游解说、地铁语音播报等应用场景。 


张格源提醒,AI生成的内容足以假乱真、瞒天过海,需要从业者们谨慎防范。 


03 AI产品,困在哪儿?朝哪儿卷?


目前国内主要的AI应用,有百度(文小言)、字节跳动(豆包)、阿里(通义)、腾讯(元宝)等大厂的大模型产品,也有创业公司“AI六小龙”,业内公认的是月之暗面(Kimi)、零一万物(万知)、MiniMax(星野)、百川智能(百小应)、智谱AI(智谱清言)、阶跃星辰(跃问)六家。 


「定焦One」和多位用户交流时,大家经常提到的产品包括豆包、文小言、Kimi等,结合近期“AI产品榜”发布的9月榜单,能更直观地看到哪些APP受到欢迎。 


据“AI产品榜”统计,截至2024年9月,国内的AI应用已经有了1.2亿月活跃用户。 其中,国内总榜月活 (MAU) 排名前五的应用分别是 豆包、文小言、Kimi、天工AI、讯飞星火。 



来源 / AI产品榜


在从业者眼中,市面上各家的AI产品表现各有千秋。 


AI从业者致远分析,每款产品的优势都是背后的公司基因决定的,产品背靠的公司所能积累下来的数据,是AI能力的根本。


他解释,文小言依托百度的搜索资料库,在办公文档方面,比如整理资料、做汇报、写文案等工作,表现不错;有阿里系庞大的电商客户的数据,通义千问更擅长电商优惠策略的设计、营销文案撰写,在电商策划运营方式、电商的SEO上辅助商家,另外,围绕电商体系,在生成图片、生成视频方面也更擅长;Kimi在C端用户使用体验上反响比较好,字节系的产品在B端更加丰富。 


总结来看,目前应用AI比较多的行业,包括内容领域、智能客服、市场营销等。 


另外,带有标准化SOP的一些场景,也会有大量的AI和自动化的能力加持。张格源介绍,在农业领域AI也得到了应用,比如水果采摘以后,有企业做了智能检测的传送带,通过视觉AI去判断哪些水果是残次品,还有农业上的病虫害检测、鲜花的病虫害以及温湿度的监测都可以利用AI的能力。 


10月份正好是高通骁龙旗舰芯片发布的时间,小米、vivo、OPPO、荣耀的旗舰手机也会随之发布,张格源预测,AI功能将会是手机厂商的重要抓手和卖点。小米的人、车、家全生态可以基于小爱大模型实现智能化万物互联。OV等厂商也在手机端侧实现给用户的AI辅助功能,例如通话内容总结等。 


接下来伴随着手机的AI能力,也许可以实现这样的场景:“我跟客户聊到要去深圳拜访,手机里就能生成明天要去深圳的待办事项,备注目标公司的地址,还可以调动OTA产品去找最合适的机票、酒店。”张格源认为,类似的AI能力,可能是下一步手机厂商的竞争方向。 


资深AI领域从业者连诗路认为,大模型应用前景广阔,但企业在获客、留存、商业化,技术发展上面临诸多挑战。 


他对比了豆包、Kimi、文小言、讯飞星火、腾讯元宝等产品的留存率后发现,用户下载之后的30日内,使用率大部分都低于1%。而“AI产品榜”8月的数据显示,国内的AI应用,用户每个月平均只使用4.3天。连诗路认为,大语言模型有非常高的应用价值,只是目前的还没有做出杀手级的应用。


另外,今年以来,大模型企业因内卷而打起了价格战,商业化难题摆在了眼前。 


最近几个月,字节、百度、阿里云、智谱AI等企业纷纷宣布降低大模型产品和服务的使用价格,不少大模型产品价格降幅达50%以上,有的产品价格降幅甚至超过90%。 


连诗路估算,降价后1元钱大约可以买到200万字符,相当于5本《新华字典》的文字量。 


有报道提到,今年5月以前,国内大模型推理算力毛利率高于60%,和国际同行基本一致,今年5月各大厂接连降价后,推测算力毛利率跌至负数。 


关于“AI六小龙”,连诗路认为,它们受数据和算力限制,进一步拓展比较难。 


不过,目前国内的AI发展产品增速和技术创新有减缓,但是产品形态和应用比较丰富和开放,AI的未来仍然可期。 


他提到,AIGC上半场是算法工程人员引领团队做数据清洗、数据集、预训练、调优、做基础模型,下半场是要挖掘AIGC的应用场景。AIGC的杀手级应用不再局限于手机、智能家居、智能汽车某一类,而是可以和万物互联,他预测AIGC杀手级应用将在2026年前展现于市场。


文章来源于“定焦One”,作者“定焦One团队


关键词: AI , AI产品 , AI应用 , 人工智能
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI音乐

【开源免费】suno-api是一个使用监听技术实现了调用suno功能,并封装好API的AI音乐项目。

项目地址:https://github.com/gcui-art/suno-api

2
AI工作流

【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费)


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/(付费)

3
声音克隆

【开源免费】MockingBird是一个5秒钟即可克隆你的声音的AI项目。

项目地址:https://github.com/babysor/MockingBird

4
数字人

【开源免费】Fay开源数字人框架是一个AI数字人项目,该项目可以帮你实现“线上线下的数字人销售员”,

“一个人机交互的数字人助理”或者是一个一个可以自主决策、主动联系管理员的智能体数字人。

项目地址:https://github.com/xszyou/Fay

5
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

6
无人直播

【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。

项目地址:https://github.com/Henry-23/VideoChat

在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat


【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。

项目地址:https://github.com/PeterH0323/Streamer-Sales