ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
从方言对话这枚“落子”,看AI手机“棋局”的尴尬赛点
2386点击    2024-11-01 10:33

AI手机,在等一个“王炸”


这段时间,手机厂商的新品发布会、开发者活动比较密集,我们团队东奔西跑,整体感觉是,手机AI确实火了,但这盘棋局,所有厂商都对弈得不太轻松。


一方面,各家都在想尽办法讲好AI故事。一位CEO在发布会后采访时就特别烦恼,“AI要讲场景,不讲场景用户没感觉,明年我们还要上很多新功能,发布会的两个小时根本讲不完”。这是手机AI越来越完善的一面。


但同时我们也发现,大家手里的牌其实都差不多,很少有哪家能靠一个或某个AI功能,就形成碾压级的体验优势。结果就是单点功能容易被复制,AI手机功能趋同。我就听过至少三个厂商表示:我们这个xx功能去年一推出就被致敬了,欢迎友商来“普及”我们这个AI功能……



假设AI手机市场是围棋对弈,观众们想看什么样的比赛过程?肯定是棋手们通过各种复杂的策略,展开激烈的劫争,才能吸引大家的注意力。而不是各方实力差不多,导致比赛过程冗长乏味、难分胜负。目前的AI手机竞争,就有点后者的意思。


在大众对AI手机这一概念的兴奋劲儿过去之前,手机厂商们必须尽快找到更聚焦的策略和体系化攻势,而不能只关注浅层的、零敲碎打的AI功能。


举个例子,方言对话,就不是AI手机的一步好棋。


方言很重要,但不是手机厂商的赛道


首先要说明的是,方言的识别、理解与生成、交互是非常重要,甚至不容有失的一个领域。


从技术能力上看,方言的语言资料少,语音识别、语义理解、语音合成等模型的打磨,也比普通话等主流语种要更复杂、成本更高,是比较能体现科技公司实力的。


从社会效益上看,国内还有20%群体没有完成普通话的普及,确实有很多人存在方言对话的需求。而且,随着大模型的到来,低资源的方言如果不能被大语言模型所学习和训练,很可能越来越弱势,甚至消失。所以,从科技普惠、文化保护的角度,方言对话也是十分必要的。


今年的几个手机厂商活动中,我们就看到了方言对话成为手机AI的一个典型用例。其中应用场景包括:


1.方言的语音理解。普通话不标准的用户发出的方言指令,也能被手机智能助手很好地理解。


2.方言的语音生成。手机智能助手可以用本地方言跟用户聊天,播报新闻等,提供更个性化、更温暖的服务。


上述功能当然是有用的,但从市场策略上来说,方言对话真的是手机厂商在AI领域的一步好棋吗?未必。


低效落子,为什么说方言对话不是一步好棋?


之所以说方言对话不是一步好棋,答案在于,市场策略的低效性。


无论是短期或长期,手机厂商想靠方言对话来带动AI手机市场,都是一件挺困难的事情。


短期看,市场营销最看重的就是“效果”,即激发消费者的行动,这就要进行好的CTA(Call To Action,行动呼吁)设计。


比如传统电视广告会呼吁“赶快拿起电话订购吧”,网页时代会将“click”“立即咨询”等按钮放在最显眼的地方,而近期手机厂商也意识到AI很难被用户感知,开始营造场景化、现场感的氛围,来让观众们身临其境。


那么,方言对话的用例展示,能够让用户做出关注、搜索、试用、购买等商业想要的行为吗?显然是很低效的。



“AI手机”的受众大多是对前沿技术、新锐功能比较感兴趣的年轻群体、极客、潮人等,普通话普及率是比较高的,方言对话固然有趣、有人情味儿,但并不会高频使用,所以转化到购买行为的概率很低。


当然,也许有人会说,方言对话很能彰显手机厂商的技术实力和人文关怀啊,这对品牌来说是一种长期利好,没错,但前提是手机厂商能在方言领域建立长期壁垒,而这几乎不可能。


一是成本很高。语音识别、理解依赖于大规模语料数据,而方言数据的采集和标注成本比普通话更高。有业内人士分享,传统单一方言的识别,需要十万小时的标注数据量才能获得比较好的效果。这意味着,手机厂商要投入极高的研发成本,去开发一个市场前景未知的小众功能。


二是技术挑战。即使有的手机厂商愿意在方言领域的耐心投入,但能否建立壁垒也要打一个问号。


目前,基础模型厂商如科大讯飞(星火大模型V4.0)、商汤科技(商量SenseChat粤语版大模型)、阿里通义实验室(粤语识别与生成大模型),基础服务商如中国电信(星辰大模型)、字节跳动(豆包大模型)、喜马拉雅(珠峰AI音频多模态大模型)等,都推出了自研的、具备方言能力的语音大模型,手机厂商想要在这一技术赛道上做到“人有我优”并不容易。友商通过基于开源模型自研或与闭源模型合作等形式,就能补齐相关能力。


所以,想要靠方言能力建立壁垒,长期为品牌价值赋能,很难做到,投资效益比也要打一个问号。


总结一下,从短期市场行动到长期品牌价值上,方言对话带来的贡献都很有限,算是一个低效落子。


其实,类似方言对话这样零敲碎打的AI功能还有不少。这暴露了AI手机目前的一个尴尬处境,就是趋势向好、细节模糊。AI应用到底怎么做?这是很多厂商还没有想好的问题。


方言这步棋,暴露了AI手机的尴尬处境


越来越多的AI功能加入手机,却面对一种硬件新品的阶段性困境:


需求模糊,必然有大量AI功能注定失败。


AI大模型作为一种新技术,用户根本不知道怎么用,甚至手机厂商、产品经理们自己也不知道。以“产品成熟时才发布”而著称的苹果,在这一轮AI浪潮中行动也是头部厂商中最慢的。这种情况下,很多AI功能是厂家根据模糊的需求或自己的产品定义拿出的探索方案,其中必然会有很多是注定失败或被遗忘的。


多点开花,难以产生压倒性的说服力。


AI+手机相结合的场景众多,手机厂商在探索中很容易多点开花,如果不成体系,就很难形成具有压倒性说服力的产品。在消费理性化的市场环境下,结果就是无法激发用户的购买欲望。一个AI功能,A厂商有,B厂商很快也能推出,既然“等等党永远不亏”,那就干脆持币以待。



方言对话,就恰好是这样一种很难拉开差距的AI功能。


整体来看,相比去年,手机中的AI应用数量,有了极大增长,场景也越来越多,从简单的文生文、文生图能力展示,与输入法、摄影、系统设置、出行服务、点餐等诸多场景都有了结合。AI作为撬动手机新一轮换机潮的关键,越来越受到了用户、媒体与分析师的认可。


面对整体向好、细节模糊的“AI手机”大趋势,手机厂商当下最需要的就是聚焦。用更清晰、体系化的产品策略来展开市场攻势,一鼓作气形成突破,快速完成对细分市场份额的占有。


比如给方言对话这一步散棋出个主意,用“让父母大胆开口说”来撬动中青年群体为长辈换机,这就需要:



1.产品精细化,在语音大模型的基础能力上,开发出中老年高频用机场景下,具有说服力的方言产品,比如方言取消续费套餐,方言搜索影视剧内容等。


2.能力体系化,除了方言对话,结合中老年用机需求,形成组合攻势。比如AI反诈、手机自动驾驶主动服务、适老化功能等,全面解决目标群体的用机困扰。


3.营销情境化,AI作为一种通用软件技术,大众还是难以理解,通过场景化、故事化的营销方式,更容易激发用户的代入感,产生兴趣和后续的行为。这就要求手机厂商改变与用户沟通的方式,从比参数、放demo、碾压友商、价格刺激等短平快式输出,转变为情境化的语言。


通过方言对话这一个AI用例,我们会发现AI手机的棋局才刚刚开始。手机作为最适合AI落地的硬件载体,行业正逐步收敛与聚焦,接下来更清晰有力的体系化AI能力与策略会逐步登场。


从一个个AI功能的零敲碎打,到体系化AI能力的强势出击,届时不同厂商也将拉开显著差距。


高水平的激烈劫争,是一场围棋赛最精彩的部分,我们会继续为大家解说大模型时代的手机赛事。


文章来自于“脑极体”,作者“藏狐”。




关键词: AI , AI手机 , AI硬件 , 人工智能
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
逆向大模型

【开源免费】kimi-free-api是一个提供长文本大模型逆向API的开渔免费技术。它支持高速流式输出、智能体对话、联网搜索、长文档解读、图像OCR、多轮对话,零配置部署,多路token支持,自动清理会话痕迹等原大模型支持的相关功能。

项目地址:https://github.com/LLM-Red-Team/kimi-free-api?tab=readme-ov-file