亚马逊千亿投资AI,CEO预测成本将降,应用潜力释放。
划重点
贾西写道:“未来AI不会像现在这样昂贵。随着更具性价比的芯片出现,以及模型蒸馏(model distillation)、提示缓存(prompt catching)、计算基础设施与模型架构持续优化,AI的单位成本将逐步降低,从而释放出更广泛的应用潜力,以满足用户的各种需求。”
贾西将当前AI的发展态势比作亚马逊云计算平台AWS的成长历程——正是AWS显著降低了计算与存储成本,才促成了“更多的创新、更优的客户体验,以及更大规模的基础设施投入”。
2025年,亚马逊计划投入高达1000亿美元用于资本支出,其中大部分将用于支持AI相关项目。贾西在致股东的信中写道:“如果你的使命是让顾客的日常生活变得更美好、更轻松,并且你相信每一次顾客体验都会被人工智能重塑,那么你就会在人工智能方面进行深入而广泛的投资。”
贾西直言:当顾客的每一次体验都将被AI重塑时,深度布局人工智能不是选择题,而是生存必答题。
自OpenAI于2022年底推出ChatGPT以来,生成式AI需求呈爆发式增长,亚马逊也在加快数据中心、网络设备及AI芯片的投资布局。
亚马逊已经陆续推出了一系列AI产品,包括自研Nova模型、Trainium芯片、购物聊天机器人,以及名为Bedrock的第三方模型服务平台,并对推出已久的Alexa语音助手进行升级,加入了生成式AI功能。
在今年的股东信中,贾西以自问自答的方式阐述了AI的重要性、资本投入以及Alexa未来规划等话题。
以下为其股东信中与AI相关的内容:
1.为什么AI如此重要?它真能如人们所言产生颠覆性影响吗?何时会发生?
生成式AI将彻底重塑我们所熟知的几乎所有客户体验,并实现那些只存在于想象中的全新场景。当前部署的AI应用主要集中在提升效率和降低成本方面,如客服、业务流程编排、工作流优化、翻译等,这已为企业节省了大量开支。
很快,AI将改变编程、搜索、购物、个人助理、基础医疗、癌症与药物研发、生物科技、机器人、航天、金融服务、社区网络等所有领域的游戏规则。部分领域已取得快速进展,而有些则尚处萌芽阶段。
但如果你的客户体验方案不打算运用这些智能模型,无法检索海量数据快速定位关键信息,不能通过反馈持续进化,甚至没有智能体功能,那么你将失去竞争力。这样的“未来”距离我们还有多远?虽然不会在一两年内实现,但也无需十年之久,其发展速度将远超以往任何技术。
2.既然AI如此重要,为何要如此激进地投入?
本质上,如果你的使命是持续改善客户生活品质,且确信AI将重塑所有客户体验,自然会进行全面而深入的AI投资。为此,亚马逊内部正在开发1000多个生成式AI应用,涵盖购物、编程、个人助理、流媒体、广告、医疗、阅读、家居设备等领域。
同时,AWS也在加速构建AI开发基础组件,比如Trainium定制AI芯片提供更具性价比的训练与推理能力,SageMaker和Bedrock提供灵活的模型构建服务,Nova模型帮助降低客户应用成本与延迟,还有智能体创建管理工具等。
这些都需要巨额资本投入。AWS面临的现实是:需求增长越快,所需的数据中心、芯片和硬件就越多,而AI芯片成本远高于传统CPU。这些资产都需要前置投入,但回报周期往往长达数月甚至数年——正如AWS过去几年展现的,最终将带来可观的自有现金流和投资回报率。
当前AI收入正以三位数的年增长率狂奔,年化收入已达数十亿美元规模。我们坚信AI是百年一遇的变革,其需求强度史无前例,此刻的激进投资将为客户、股东和企业创造长期价值。
3.AI成本为何居高不下?未来会改善吗?
未来AI不会像现在这样昂贵,芯片是造成高成本的最大原因。现有AI生态过度依赖单一供应商,这导致价格畸高。我们的Trainium2芯片相比主流GPU已实现30-40%的性价比提升。
虽然模型训练仍占AI支出的很大部分,但未来成本大头将是推理环节(模型预测输出),因为客户会定期训练模型,却需要持续进行大规模推理。推理将与计算、存储、数据库一样成为基础服务。
我们正全力降低推理成本:随着更具性价比的芯片出现,以及模型蒸馏、提示缓存、计算基础设施与模型架构持续优化,AI的单位成本将逐步降低,从而释放出更广泛的应用潜力,以满足用户的各种需求。
4.个人助理为何尚未普及?Alexa如何破局?
理想的个人助理应能解答任何问题,并代用户执行任务,但现有数字方案都无法同时做到这两点,直到Alexa+问世。
它不仅具备顶尖聊天机器人的智能水平,更能完成海量实际操作,包括播放音乐和视频、跨设备传输文件、设置提醒、控制智能家居设备、订购商品、预订餐厅/网约车/演唱会门票、追踪艺人巡演通知、联系水管工维修、记录用户在亚马逊的所有购物历史等。
对消费者而言,这堪称是革命性的体验,而这仅是Alexa+的起点。目前,全球有6亿台Alexa设备,未来Alexa+将在数亿用户的生活中发挥更加重要的作用。(腾讯科技特约编译金鹿)
本文来自“腾讯科技”,作者:无忌
【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。
项目地址:https://github.com/browser-use/browser-use
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0