云计算一哥，刚刚重新定义了AI Agent的玩法

8046点击 2025-07-18 12:29

80分钟的一场活动，Agent的“出镜次数”竟能高达217次。

解锁平均20多秒就提一次Agent的，正是云计算一哥，亚马逊云科技。

为何会如此？

因为就在刚刚的纽约峰会上，亚马逊云科技可以说是重新定义了部署AI Agent到生产环境中的方式——

正式发布Amazon Bedrock AgentCore，一个企业级的AI Agent搭建工具包。

云计算一哥，刚刚重新定义了AI Agent的玩法

如果说以往的AI Agent要部署到实际生产中，其结果更像是一个“毛坯房”，其间有太多问题亟需解决。

比如你想开发一个智能客服、个人助手或者业务流程自动化工具，这个过程都需要整合大语言模型、连接数据库、调用各种API，并让系统能够智能决策。

AgentCore就像是为这些应用提供的“智能大脑”，可以帮你统一管理和协调所有组件，让复杂的AI应用开发变得简单高效。

之前的Amazon Bedrock提供的能力更加聚焦在基础大模型本身，比如调用Claude、Meta、Nova、Mistral等大模型，有点类似于“租用大脑”。

而AgentCore则是在这个基础上提供一个“智能体搭建工具包”，让你能把这些大脑组合起来完成具体任务。

具体而言，它是涵盖7大核心服务的一套组合拳，把部署AI Agent到生产过程中的各种细节内容都照顾到位了，有一种直接“拎包入住精装房”的感觉：

云计算一哥，刚刚重新定义了AI Agent的玩法

AgentCore Runtime：

提供低延迟的无服务器环境，支持会话隔离，兼容任何代理框架（包括开源框架），能够处理多模态工作负载和长期运行的Agent。通过AgentCore SDK在代码中添加几行代码，指定入口点函数，即可将代理部署到云端。

AgentCore Memory：

管理会话和长期记忆，为模型提供上下文信息，帮助Agent从过去的交互中学习。对于短期记忆，通过create_event存储Agent交互，通过list_events加载最近的对话内容；对于长期记忆，支持语义记忆策略（如用户偏好、总结和事实捕获），数据以加密形式存储，并支持基于命名空间的数据分割。

AgentCore Observability：

提供代理执行的逐步可视化，包括元数据标记、自定义评分、轨迹检查和故障排除/调试过滤器。可以帮助开发者调试、审计和监控Agent性能，内置仪表板用于跟踪关键操作指标（如会话数、延迟、错误率等），支持OpenTelemetry以集成现有可观测性平台。

AgentCore Identity：

使AI Agent能够安全地访问亚马逊云科技服务和第三方工具（如GitHub、Salesforce、Slack），支持基于用户身份或预授权用户同意的操作。通过创建工作负载身份和凭证提供者（如OAuth2、API密钥），Agent可以使用这些凭证安全地访问资源。

AgentCore Gateway：

将现有的API和Lambda函数转换为可用于代理的工具，提供跨协议（包括MCP）的统一访问和运行时发现，提供双重身份验证模型以确保安全。

AgentCore Browser：

提供托管的网页浏览器实例，扩展Agent的Web自动化工作流。可以用于访问没有程序化API的系统或需要通过Web界面访问的资源。

AgentCore Code Interpreter：

提供隔离环境以运行代理生成的代码。用于执行需要计算的任务，例如客户支持Agent需要进行的计算。

云计算一哥，刚刚重新定义了AI Agent的玩法

这些服务既可以单独使用，也经过优化能够无缝协作，开发者不用再花时间去拼凑各种组件了。

AgentCore是首个提供完全开发灵活性的企业级无服务器AI代理运行时平台，支持任何框架、模型和协议，具备8小时工作负载支持、严格安全边界和按需付费的可组合服务架构。

一言蔽之，再大规模的AI Agent，现在AgentCore这里，都可以安全操作和部署。

由此作为最为关键的发布，亚马逊云科技在今天的活动中，不论是在基础设施、模型架构，亦或是应用上，均围绕着Agent来展开。

云计算一哥，刚刚重新定义了AI Agent的玩法

之所以如此，亚马逊云科技Agentic AI副总裁Swami Sivasubramanian的话来说就是：

未来的关键在于让所有Agents和工具协同工作。

云计算一哥，刚刚重新定义了AI Agent的玩法

不仅要方便，还要够靠谱

为了更方便操作，基于AgentCore，亚马逊云科技还推出了Marketplace中的AI Agents和工具，只需要通过自然语言搜索，客户就可以轻松描述使用场景并找到相关解决方案（目前已经有数百种）。

云计算一哥，刚刚重新定义了AI Agent的玩法

除此之外，亚马逊云科技在Amazon SageMaker AI中还推出了Amazon Nova定制化的功能。

客户现在可以在模型训练生命周期中对Nova Micro、Nova Lite和Nova Pro进行定制，包括预训练、监督微调和对齐。

云计算一哥，刚刚重新定义了AI Agent的玩法

据了解，这些技术作为现成的Amazon SageMaker配方提供，并支持无缝部署到Amazon Bedrock，满足按需和预置吞吐量推理的需求。

针对AI Agent许多功能过分依赖API的问题，亚马逊云科技还推出了Amazon Nova Act来打破这一局限——

创建能够在网页浏览器中执行任务的AI Agent。

云计算一哥，刚刚重新定义了AI Agent的玩法

与此同时，亚马逊云科技一道还发布了Amazon Nova Act SDK的研究预览版，用这个SDK，开发者就可以很方便地创建能够自动执行网页任务的AI Agent。

为了进一步提高准确性，SDK支持通过Playwright进行浏览器操作、API调用、Python集成以及并行线程处理，以克服网页加载延迟。

在内部评估中，Amazon Nova Act针对特定能力取得了超过90%的高分，例如在ScreenSpot Web文本基准测试中得分0.939。

由此可见，亚马逊云科技在打造AI Agent这件事上，不仅追求可用度，更加注重可靠性。

数据库也很AI Agent

亚马逊云科技针对AI Agent这个主旋律，还在数据层上下足了功夫。

众所周知，向量（Vectors）可以说是AI的语言，它可以把文字、图像等内容转成大模型能理解的数字格式。

对于现代企业来说，AI Agent将向量用于两个关键功能，一个是用于从过去的互动中构建上下文，另一个是发现海量数据集中的相似性内容。

但现在面临的一个问题是，目前的知识、数据规模变得越来越大，它们不再仅仅是临时资源，更是必须长期保存的战略资源。

为此，亚马逊云科技推出了Amazon S3 Vectors——首个原生支持存储大规模向量数据集、并提供亚秒级查询性能的云对象存储服务。

云计算一哥，刚刚重新定义了AI Agent的玩法

它最大的亮点，就是直接把上传、存储和查询向量的总成本降低多达90%！

云计算一哥，刚刚重新定义了AI Agent的玩法

从技术角度来看，S3 Vectors推出了一种叫“向量桶”（vector buckets）的新存储类型，它有专门的API接口，让我们可以存储、访问和查询向量数据，而且不需要自己搭建任何基础设施。

当创建一个S3向量桶时，我们的向量数据会被组织在“向量索引”（vector index）中，这样就能很简单地对数据集进行相似性搜索。

据了解，每个向量桶最多可以有10000个向量索引，每个向量索引可以存储数千万个向量。

云计算一哥，刚刚重新定义了AI Agent的玩法

在创建向量索引后，当我们往索引里添加向量数据时，还可以给每个向量附加一些元数据（以键值对的形式），这样一来查询时就能根据特定条件进行过滤，比如按日期、类别或用户偏好来筛选。

随着时间推移，当你对向量进行写入、更新和删除操作时，S3 Vectors会自动优化这些向量数据，确保在向量存储方面达到最佳的性价比，即使数据集规模不断扩大和变化也是如此。

云计算一哥，刚刚重新定义了AI Agent的玩法

S3 Vectors还与Amazon Bedrock Knowledge Bases（包括Amazon SageMaker Unified Studio）原生集成，用于构建成本效益高的检索增强生成（RAG）应用。

通过与Amazon OpenSearch Service的集成，我们可以把不常查询的向量放在S3 Vectors中来降低存储成本，然后在需求增加时快速将它们转移到OpenSearch，或者用于支持实时、低延迟的搜索操作。

云计算一哥，刚刚重新定义了AI Agent的玩法

亚马逊云科技的AI Agent之道，已经改变了AI编程

除了基础设施和模型层面之外，亚马逊云科技在应用上还拿出了一款全新的免费AI编程工具，Kiro。

云计算一哥，刚刚重新定义了AI Agent的玩法

若是用一句话概括Kiro的亮点，那就是只要你有想法，它就能帮你把这个想法变成实际可用的软件，而且是从项目启动、设计、编程到最终维护，全程都有专业级的Agent深度参与。

例如我们要给电商网站添加一个评论系统，现在就只需要三步即可。

第一步，把一句话需求变成详细计划：

为产品添加评论系统。

云计算一哥，刚刚重新定义了AI Agent的玩法

可以看到，Kiro秒懂了你的意图，马上把这句简单的话，分解成一个个具体的用户场景和需求。

比如，它会想到“用户要能看评论”、“用户要能写评论”、“用户可以筛选评论”、“用户可以给评论打分”等等。

并且，Kiro会把每个需求的验收标准都写得清清楚楚，就像一份详细的需求文档，避免了后续理解上的偏差。

第二步，根据计划自动生成“施工图纸”。

在咱们确认了第一步的需求计划后，Kiro就会自己去研究现有的项目代码；然后，它会自动生成一份技术“施工图纸”。

这份图纸非常专业，包括数据怎么流动、需要哪些新的数据接口和数据库设计等等。

比如，它会设计好“评论”这个东西具体应该包含哪些信息（如评论内容、评分、用户ID等）。

云计算一哥，刚刚重新定义了AI Agent的玩法

第三步，把“图纸”变成一个个具体的“施工任务”。

在这个步骤中，Kiro会根据上一步的“施工图纸”，把整个开发工作拆分成一个个小任务，并且按照“先做什么后做什么”的依赖关系排好顺序。

每个小任务都写得非常具体，比如“写单元测试”、“做集成测试”、“考虑加载时的页面状态”、“适配手机版”、“保证无障碍使用”等等。

云计算一哥，刚刚重新定义了AI Agent的玩法

或许此时你就要问了，Kiro和其它的编程AI有什么区别？

其实从刚才的展示过程中应该也能或多或少地感受到，在亚马逊云科技开辟的AI Agent新生产范式之下，正如网友所说：

Kiro规范化了AI编程的工作流程。

云计算一哥，刚刚重新定义了AI Agent的玩法

以上便是此次发布的主要内容了，整体来看，亚马逊云科技再一次从基础设施、模型框架以及应用三个层面来了个“大焕新”，而这一次的主角，毫无疑问就是AI Agent。

而这一切，所影射的实则是云计算一哥下的一盘大棋。

Why AI Agent？Why 亚马逊云科技？

对于第一个问题，若是用Swami Sivasubramanian在现场所陈述的愿景来解释，那就是：

让亚马逊云科技成为构建世界上最有用的AI Agents的最佳场所。

云计算一哥，刚刚重新定义了AI Agent的玩法

在亚马逊云科技看来，AI Agent的意义不仅仅是一个技术概念，更是企业组织效率的跃迁工具。

借助Agentic AI，企业可以将重复性强、逻辑明确的任务交由智能体完成，让员工专注于更具创造力与战略性的事务。

通过AI Agent，亚马逊云科技可以帮助客户简化流程、提升响应速度，并释放团队潜能，从而改变业务运作方式。

而纵观今天所有的新发布，虽然它们的细分功能各有侧重，但小目标均是剑指于此。

例如为了让更多企业快速找到、试用并部署Agent，亚马逊云科技在其Marketplace市场中新增了“AI Agents & Tools”分类。

再如为了解决许多AI Agent只能停留在原型验证阶段，缺乏可扩展性与安全保障的问题，亚马逊云科技推出的Amazon Bedrock AgentCore就专门为生产级AI Agent而设计。

以及面向开发者，诸如Kiro这样的AI编程应用，更是重新规范了AI Agent在编程任务中的流程，目标依旧是能够保障“生产级”。

如此考量的背后，也有市场发展的预期所支撑。根据最新调查数据，AI Agents正迅速成为企业主流应用。

LangChain调查显示，超过50%的公司已在生产环境中部署agent，近80%正在开发中。Gartner预测到2028年，33%的企业软件将包含Agentic AI（相比2024年不到1%），15%的日常工作决策将由其自主完成，并将取代20%的人类店面互动。

企业更青睐能查询多个任务特定模型的Agentic AI功能而非单一基础模型，这种多语言模型方法具有更强的跨领域扩展性。目前，软件开发、客户服务、理赔处理和IT流程自动化是Agentic AI的主要早期应用场景。

并且从技术发展的角度来看，目前几乎所有的生成式AI产品或应用，均离不开AI Agent这个关键词。

由此，就不难理解为什么亚马逊云科技如此关注AI Agent了，正如CEO Matt Garman所说：

AI Agent将改变我们所有人的工作和生活方式，其影响力堪比互联网的诞生。

大趋势已经指向AI Agent，科技巨头又以“all in”之势发力于此，双重认证之下已然证明了AI Agent的重要性；但更重要的一点是，云计算一哥已然给业界交付了“快好省”投入生产的新范式。

文章来自于微信公众号“量子位”。

关键词: AI新闻 , Amazon Bedrock AgentCore , 亚马逊AI , AI编程

AITNT资源拓展

根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考

OWL

【开源免费】OWL是一个完全开源免费的通用智能体项目。它可以远程开Ubuntu容器、自动挂载数据、做规划、执行任务，堪称「云端超级打工人」而且做到了开源界GAIA性能天花板，达到了57.7%，超越Huggingface 提出的Open Deep Research 55.15%的表现。
项目地址：GitHub：https://github.com/camel-ai/owl

AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务，如比较价格、添加购物车、回复各种社交媒体等。
项目地址：https://github.com/browser-use/browser-use

AI工作流

【开源免费】字节工作流产品扣子两大核心业务：Coze Studio（扣子开发平台）和 Coze Loop（扣子罗盘）全面开源，而且采用的是 Apache 2.0 许可证，支持商用！
项目地址：https://github.com/coze-dev/coze-studio

【开源免费】n8n是一个可以自定义工作流的AI项目，它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址：https://github.com/n8n-io/n8n
在线使用：https://n8n.io/（付费）

【开源免费】DB-GPT是一个AI原生数据应用开发框架，它提供开发多模型管理（SMMF）、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL（智能体工作流编排）等多种技术能力，让围绕数据库构建大模型应用更简单、更方便。
项目地址：https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file


【开源免费】VectorVein是一个不需要任何编程基础，任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤，并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址：https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用：https://vectorvein.ai/（付费）

智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的（AI Agents）项目。用户创建的智能体能够自动执行各种任务，从而让AI有步骤的去解决实际问题。
项目地址：https://github.com/Significant-Gravitas/AutoGPT

﻿【开源免费】MetaGPT是一个“软件开发公司”的智能体项目，只需要输入一句话的老板需求，MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色，包括产品经理 / 架构师 / 项目经理 / 工程师，MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址：https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

RAG

【开源免费】graphrag是微软推出的RAG项目，与传统的通过 RAG 方法使用向量相似性作为搜索技术不同，GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址：https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG，Agent，模型管理等一站式AI开发的工具平台，并且项目方一直持续维护。其中在任务编排方面相对领先对手，可以帮助研发实现像字节扣子那样的功能。
项目地址：https://github.com/langgenius/dify

【开源免费】RAGFlow是和Dify类似的开源项目，该项目在大文件解析方面做的更出色，拓展编排方面相对弱一些。
项目地址：https://github.com/infiniflow/ragflow/tree/main

【开源免费】phidata是一个可以实现将数据转化成向量存储，并通过AI实现RAG功能的项目
项目地址：https://github.com/phidatahq/phidata

【开源免费】TaskingAI 是一个提供RAG，Agent，大模型管理等AI项目开发的工具平台，比LangChain更强大的中间件AI平台工具。
项目地址：https://github.com/TaskingAI/TaskingAI

微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台，可以对大语言模型（LLM）和多模态图文模型（VLM）进行预训练和轻量级微调。XTuner 支持多种微调算法，如 QLoRA、LoRA 和全量参数微调。
项目地址：https://github.com/InternLM/xtuner