云计算一哥,刚刚重新定义了AI Agent的玩法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
云计算一哥,刚刚重新定义了AI Agent的玩法
5651点击    2025-07-18 12:29

80分钟的一场活动,Agent的“出镜次数”竟能高达217次。


解锁平均20多秒就提一次Agent的,正是云计算一哥,亚马逊云科技


为何会如此?


因为就在刚刚的纽约峰会上,亚马逊云科技可以说是重新定义了部署AI Agent到生产环境中的方式——


正式发布Amazon Bedrock AgentCore,一个企业级的AI Agent搭建工具包。


云计算一哥,刚刚重新定义了AI Agent的玩法


如果说以往的AI Agent要部署到实际生产中,其结果更像是一个“毛坯房”,其间有太多问题亟需解决。


比如你想开发一个智能客服、个人助手或者业务流程自动化工具,这个过程都需要整合大语言模型、连接数据库、调用各种API,并让系统能够智能决策。


AgentCore就像是为这些应用提供的“智能大脑”,可以帮你统一管理和协调所有组件,让复杂的AI应用开发变得简单高效。


之前的Amazon Bedrock提供的能力更加聚焦在基础大模型本身,比如调用Claude、Meta、Nova、Mistral等大模型,有点类似于“租用大脑”。


而AgentCore则是在这个基础上提供一个“智能体搭建工具包”,让你能把这些大脑组合起来完成具体任务。


具体而言,它是涵盖7大核心服务的一套组合拳,把部署AI Agent到生产过程中的各种细节内容都照顾到位了,有一种直接“拎包入住精装房”的感觉:


云计算一哥,刚刚重新定义了AI Agent的玩法


  • AgentCore Runtime:


提供低延迟的无服务器环境,支持会话隔离,兼容任何代理框架(包括开源框架),能够处理多模态工作负载和长期运行的Agent。通过AgentCore SDK在代码中添加几行代码,指定入口点函数,即可将代理部署到云端。


  • AgentCore Memory:


管理会话和长期记忆,为模型提供上下文信息,帮助Agent从过去的交互中学习。对于短期记忆,通过create_event存储Agent交互,通过list_events加载最近的对话内容;对于长期记忆,支持语义记忆策略(如用户偏好、总结和事实捕获),数据以加密形式存储,并支持基于命名空间的数据分割。


  • AgentCore Observability:


提供代理执行的逐步可视化,包括元数据标记、自定义评分、轨迹检查和故障排除/调试过滤器。可以帮助开发者调试、审计和监控Agent性能,内置仪表板用于跟踪关键操作指标(如会话数、延迟、错误率等),支持OpenTelemetry以集成现有可观测性平台。


  • AgentCore Identity:


使AI Agent能够安全地访问亚马逊云科技服务和第三方工具(如GitHub、Salesforce、Slack),支持基于用户身份或预授权用户同意的操作。通过创建工作负载身份和凭证提供者(如OAuth2、API密钥),Agent可以使用这些凭证安全地访问资源。


  • AgentCore Gateway:


将现有的API和Lambda函数转换为可用于代理的工具,提供跨协议(包括MCP)的统一访问和运行时发现,提供双重身份验证模型以确保安全。


  • AgentCore Browser:


提供托管的网页浏览器实例,扩展Agent的Web自动化工作流。可以用于访问没有程序化API的系统或需要通过Web界面访问的资源。


  • AgentCore Code Interpreter:


提供隔离环境以运行代理生成的代码。用于执行需要计算的任务,例如客户支持Agent需要进行的计算。


云计算一哥,刚刚重新定义了AI Agent的玩法


这些服务既可以单独使用,也经过优化能够无缝协作,开发者不用再花时间去拼凑各种组件了。


AgentCore是首个提供完全开发灵活性的企业级无服务器AI代理运行时平台,支持任何框架、模型和协议,具备8小时工作负载支持、严格安全边界和按需付费的可组合服务架构。


一言蔽之,再大规模的AI Agent,现在AgentCore这里,都可以安全操作和部署。


由此作为最为关键的发布,亚马逊云科技在今天的活动中,不论是在基础设施、模型架构,亦或是应用上,均围绕着Agent来展开。


云计算一哥,刚刚重新定义了AI Agent的玩法


之所以如此,亚马逊云科技Agentic AI副总裁Swami Sivasubramanian的话来说就是:


未来的关键在于让所有Agents和工具协同工作。


云计算一哥,刚刚重新定义了AI Agent的玩法


不仅要方便,还要够靠谱


为了更方便操作,基于AgentCore,亚马逊云科技还推出了Marketplace中的AI Agents和工具,只需要通过自然语言搜索,客户就可以轻松描述使用场景并找到相关解决方案(目前已经有数百种)。


云计算一哥,刚刚重新定义了AI Agent的玩法


除此之外,亚马逊云科技在Amazon SageMaker AI中还推出了Amazon Nova定制化的功能。


客户现在可以在模型训练生命周期中对Nova Micro、Nova Lite和Nova Pro进行定制,包括预训练、监督微调和对齐。


云计算一哥,刚刚重新定义了AI Agent的玩法


据了解,这些技术作为现成的Amazon SageMaker配方提供,并支持无缝部署到Amazon Bedrock,满足按需和预置吞吐量推理的需求。


针对AI Agent许多功能过分依赖API的问题,亚马逊云科技还推出了Amazon Nova Act来打破这一局限——


创建能够在网页浏览器中执行任务的AI Agent。


云计算一哥,刚刚重新定义了AI Agent的玩法


与此同时,亚马逊云科技一道还发布了Amazon Nova Act SDK的研究预览版,用这个SDK,开发者就可以很方便地创建能够自动执行网页任务的AI Agent。


为了进一步提高准确性,SDK支持通过Playwright进行浏览器操作、API调用、Python集成以及并行线程处理,以克服网页加载延迟。


在内部评估中,Amazon Nova Act针对特定能力取得了超过90%的高分,例如在ScreenSpot Web文本基准测试中得分0.939。


由此可见,亚马逊云科技在打造AI Agent这件事上,不仅追求可用度,更加注重可靠性。


数据库也很AI Agent


亚马逊云科技针对AI Agent这个主旋律,还在数据层上下足了功夫。


众所周知,向量(Vectors)可以说是AI的语言,它可以把文字、图像等内容转成大模型能理解的数字格式。


对于现代企业来说,AI Agent将向量用于两个关键功能,一个是用于从过去的互动中构建上下文,另一个是发现海量数据集中的相似性内容。


但现在面临的一个问题是,目前的知识、数据规模变得越来越大,它们不再仅仅是临时资源,更是必须长期保存的战略资源。


为此,亚马逊云科技推出了Amazon S3 Vectors——首个原生支持存储大规模向量数据集、并提供亚秒级查询性能的云对象存储服务。


云计算一哥,刚刚重新定义了AI Agent的玩法


它最大的亮点,就是直接把上传、存储和查询向量的总成本降低多达90%!


云计算一哥,刚刚重新定义了AI Agent的玩法


从技术角度来看,S3 Vectors推出了一种叫“向量桶”(vector buckets)的新存储类型,它有专门的API接口,让我们可以存储、访问和查询向量数据,而且不需要自己搭建任何基础设施。


当创建一个S3向量桶时,我们的向量数据会被组织在“向量索引”(vector index)中,这样就能很简单地对数据集进行相似性搜索。


据了解,每个向量桶最多可以有10000个向量索引,每个向量索引可以存储数千万个向量。


云计算一哥,刚刚重新定义了AI Agent的玩法


在创建向量索引后,当我们往索引里添加向量数据时,还可以给每个向量附加一些元数据(以键值对的形式),这样一来查询时就能根据特定条件进行过滤,比如按日期、类别或用户偏好来筛选。


随着时间推移,当你对向量进行写入、更新和删除操作时,S3 Vectors会自动优化这些向量数据,确保在向量存储方面达到最佳的性价比,即使数据集规模不断扩大和变化也是如此。


云计算一哥,刚刚重新定义了AI Agent的玩法


S3 Vectors还与Amazon Bedrock Knowledge Bases(包括Amazon SageMaker Unified Studio)原生集成,用于构建成本效益高的检索增强生成(RAG)应用。


通过与Amazon OpenSearch Service的集成,我们可以把不常查询的向量放在S3 Vectors中来降低存储成本,然后在需求增加时快速将它们转移到OpenSearch,或者用于支持实时、低延迟的搜索操作。


云计算一哥,刚刚重新定义了AI Agent的玩法


亚马逊云科技的AI Agent之道,已经改变了AI编程


除了基础设施和模型层面之外,亚马逊云科技在应用上还拿出了一款全新的免费AI编程工具,Kiro


云计算一哥,刚刚重新定义了AI Agent的玩法


若是用一句话概括Kiro的亮点,那就是只要你有想法,它就能帮你把这个想法变成实际可用的软件,而且是从项目启动、设计、编程到最终维护,全程都有专业级的Agent深度参与。


例如我们要给电商网站添加一个评论系统,现在就只需要三步即可。


第一步,把一句话需求变成详细计划:


为产品添加评论系统。


云计算一哥,刚刚重新定义了AI Agent的玩法


可以看到,Kiro秒懂了你的意图,马上把这句简单的话,分解成一个个具体的用户场景和需求。


比如,它会想到“用户要能看评论”、“用户要能写评论”、“用户可以筛选评论”、“用户可以给评论打分”等等。


并且,Kiro会把每个需求的验收标准都写得清清楚楚,就像一份详细的需求文档,避免了后续理解上的偏差。


第二步,根据计划自动生成“施工图纸”。


在咱们确认了第一步的需求计划后,Kiro就会自己去研究现有的项目代码;然后,它会自动生成一份技术“施工图纸”。


这份图纸非常专业,包括数据怎么流动、需要哪些新的数据接口和数据库设计等等。


比如,它会设计好“评论”这个东西具体应该包含哪些信息(如评论内容、评分、用户ID等)。


云计算一哥,刚刚重新定义了AI Agent的玩法


第三步,把“图纸”变成一个个具体的“施工任务”。


在这个步骤中,Kiro会根据上一步的“施工图纸”,把整个开发工作拆分成一个个小任务,并且按照“先做什么后做什么”的依赖关系排好顺序。


每个小任务都写得非常具体,比如“写单元测试”、“做集成测试”、“考虑加载时的页面状态”、“适配手机版”、“保证无障碍使用”等等。


云计算一哥,刚刚重新定义了AI Agent的玩法


或许此时你就要问了,Kiro和其它的编程AI有什么区别?


其实从刚才的展示过程中应该也能或多或少地感受到,在亚马逊云科技开辟的AI Agent新生产范式之下,正如网友所说:


Kiro规范化了AI编程的工作流程。


云计算一哥,刚刚重新定义了AI Agent的玩法


以上便是此次发布的主要内容了,整体来看,亚马逊云科技再一次从基础设施、模型框架以及应用三个层面来了个“大焕新”,而这一次的主角,毫无疑问就是AI Agent。


而这一切,所影射的实则是云计算一哥下的一盘大棋。


Why AI Agent?Why 亚马逊云科技?


对于第一个问题,若是用Swami Sivasubramanian在现场所陈述的愿景来解释,那就是:


让亚马逊云科技成为构建世界上最有用的AI Agents的最佳场所。


云计算一哥,刚刚重新定义了AI Agent的玩法


在亚马逊云科技看来,AI Agent的意义不仅仅是一个技术概念,更是企业组织效率的跃迁工具。


借助Agentic AI,企业可以将重复性强、逻辑明确的任务交由智能体完成,让员工专注于更具创造力与战略性的事务。


通过AI Agent,亚马逊云科技可以帮助客户简化流程、提升响应速度,并释放团队潜能,从而改变业务运作方式。


而纵观今天所有的新发布,虽然它们的细分功能各有侧重,但小目标均是剑指于此。


例如为了让更多企业快速找到、试用并部署Agent,亚马逊云科技在其Marketplace市场中新增了“AI Agents & Tools”分类。


再如为了解决许多AI Agent只能停留在原型验证阶段,缺乏可扩展性与安全保障的问题,亚马逊云科技推出的Amazon Bedrock AgentCore就专门为生产级AI Agent而设计。


以及面向开发者,诸如Kiro这样的AI编程应用,更是重新规范了AI Agent在编程任务中的流程,目标依旧是能够保障“生产级”。


如此考量的背后,也有市场发展的预期所支撑。根据最新调查数据,AI Agents正迅速成为企业主流应用。


LangChain调查显示,超过50%的公司已在生产环境中部署agent,近80%正在开发中。Gartner预测到2028年,33%的企业软件将包含Agentic AI(相比2024年不到1%),15%的日常工作决策将由其自主完成,并将取代20%的人类店面互动。


企业更青睐能查询多个任务特定模型的Agentic AI功能而非单一基础模型,这种多语言模型方法具有更强的跨领域扩展性。目前,软件开发、客户服务、理赔处理和IT流程自动化是Agentic AI的主要早期应用场景。


并且从技术发展的角度来看,目前几乎所有的生成式AI产品或应用,均离不开AI Agent这个关键词。


由此,就不难理解为什么亚马逊云科技如此关注AI Agent了,正如CEO Matt Garman所说:


AI Agent将改变我们所有人的工作和生活方式,其影响力堪比互联网的诞生。


大趋势已经指向AI Agent,科技巨头又以“all in”之势发力于此,双重认证之下已然证明了AI Agent的重要性;但更重要的一点是,云计算一哥已然给业界交付了“快好省”投入生产的新范式。


文章来自于微信公众号“量子位”。


AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
OWL

【开源免费】OWL是一个完全开源免费的通用智能体项目。它可以远程开Ubuntu容器、自动挂载数据、做规划、执行任务,堪称「云端超级打工人」而且做到了开源界GAIA性能天花板,达到了57.7%,超越Huggingface 提出的Open Deep Research 55.15%的表现。

项目地址:GitHub:https://github.com/camel-ai/owl

2
AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。

项目地址:https://github.com/browser-use/browser-use


3
AI工作流

【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费)


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/(付费)

4
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

5
RAG

【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。

项目地址:https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。

项目地址:https://github.com/langgenius/dify


【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。

项目地址:https://github.com/infiniflow/ragflow/tree/main


【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目

项目地址:https://github.com/phidatahq/phidata


【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。

项目地址:https://github.com/TaskingAI/TaskingAI

6
微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。

项目地址:https://github.com/InternLM/xtuner