图片来源:a16z
Olivia Moore,a16z消费者投资团队的合伙人,专注于人工智能领域。本文为其对AI语音Agent发展及未来的解读。
图片来源:a16z
模型开发的进步简化了基础设施栈,使得语音Agent的延迟更低,性能更优。这一改进主要在过去六个月内随着新型对话模型的推出而实现。
这些对话模型随着时间推移也变得更加经济实惠。2024年12月,OpenAI将GPT-4o实时API的输入价格降低了60%(至$40/百万tokens),输出价格降低了87.5%(至$2.50/百万tokens)。GPT-4o mini现在也可通过实时API使用。
图片来源:a16z
图片来源:a16z
语音Agent市场在2024年下半年迎来爆发式增长。一个数据点表明:据Cartesia统计,在最新一届YC中,构建语音相关产品的公司占比达22%。
图片来源:a16z
语音Agent也正在被集成到更多横向或多模态产品中。在2024年,我们看到对话式语音技术栈的多个层面吸引了资金和市场关注,包括:模型公司:如ElevenLabs和Cartesia、横向平台:如Vapi和Bland以及垂直化平台:如HappyRobot和Wayfaster。
图片来源:a16z
不过,对于大型企业,我们很少看到从完全由人工接听电话直接跃迁到完全由AI接听。创始人通常会找到一个“楔子”切入市场,先捕捉客户中较小比例的通话——然后逐步扩展,覆盖更多类型的通话和工作流程。
图片来源:a16z
语音Agent的早期应用通常集中在呼叫中心/BPO支出较高的行业。如果通话由本地员工作为日常工作的一部分处理,则可能面临以下挑战:一是痛点或收益不够显著——除非有大量员工专职接听或拨打电话;二是难以量化结果和节省成本,从而难以建立明确的商业案例。
我们预计以下领域将会出现大量创业者:金融服务(例如债务催收)、保险(覆盖客户服务和后台运营)、政府、支持服务(包括需要专业知识的复杂客户服务通话如IT支持)。这些主要垂直领域(金融服务、B2C、B2B、政府和医疗)通常拥有各自的核心服务提供商,就像它们有专属的数据记录系统一样。
在“呼叫中心类别”之外,我们发现AI语音Agent在教练培训等场景下也有较强的付费意愿,主要针对高薪岗位。在这些行业中,逼真的语音Agent可以充当“模拟器”,大幅提升实际工作表现,从而替代人工培训(如销售教练)或低效的软件解决方案。
为了观察早期创业者的动向,我们参考了YC公司的数据。
图片来源:a16z
自2020年以来,已有90家语音Agent公司成立,且这一趋势正在加速——其中10家属于W25批次(尚未完全公布)。许多公司是在过去一年内转型进入语音Agent领域。
YC创业者在语音Agent方向上的布局主要集中于:B2B(69%)、医疗(18%)、消费级应用(13%)。而在B2B领域,最常见的细分行业包括:金融科技(16.9%)、运营支持(主要是客户服务,12.4%)。
另外,在医疗领域,语音Agent主要面向前台(面向患者)或后台(面向药房、保险等),重点覆盖:人类医学(11.2%)、牙科(3.4%)、兽医(2.2%)和物理治疗(1.1%)。
图片来源:a16z
原文:Al Voice Agents: 2025 Update
https://a16z.com/ai-voice-Agents-2025-update/
编译:KunyeQian;Yvonne
文章来自于“Z Highlights”,作者“Olivia Moore”。
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【免费】ffa.chat是一个完全免费的GPT-4o镜像站点,无需魔法付费,即可无限制使用GPT-4o等多个海外模型产品。
在线使用:https://ffa.chat/