[翻译] AI Agent 的 Zero Trust 框架|Anthropic 安全白皮书

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
[翻译] AI Agent 的 Zero Trust 框架|Anthropic 安全白皮书
7591点击    2026-05-28 15:12

写在大家不会看的地方:AGI Bar,即将在上海开业


[翻译] AI Agent 的 Zero Trust 框架|Anthropic 安全白皮书


原文链接:https://claude.com/blog/zero-trust-for-ai-agents


Zero Trust 是一套安全架构,核心前提很简单:不信任任何东西,必须验证一切


不管请求来自公司内网还是外部,一律验证身份和权限。这套思路 1994 年就有了,NIST 在 2020 年发了标准(SP 800-207),NSA 在 2026 年跟进了实施指南


Anthropic 这份白皮书讲的是:当 AI agent 开始自主执行操作、调用工具、跨系统协作时,怎么把 Zero Trust 原则落地到 agent 部署上。几个看点:


 AI 加速了攻防两端,漏洞到利用的时间窗口从几个月压缩到几小时


 提出了「不可能还是麻烦」的设计检验标准,专治摩擦型安全措施


 六大安全能力域,每个都给了 Foundation / Enterprise / Advanced 三级路线图


 八步部署工作流,从需求识别到度量指标,可以直接拿来用


 防御运营要跟上自主攻击的速度,SOAR 要进化成 Agentic SOAR


为什么 AI Agent 需要 Zero Trust


基于边界的网络安全防御已经跟不上现代威胁的节奏。前沿 AI 模型正在把漏洞到利用之间的时间窗口从几个月压缩到几个小时,边际成本按美元计。模型现在就能找到传统工具和人工审计连续几年都没发现的严重漏洞


对部署 agent 的组织来说,这种加速产生了双重影响。第一,agent 运行的基础设施和你其他资产一样,暴露在 AI 加速的攻击面前。第二,agent 本身引入了自主性,能解读目标、选择工具、执行多步操作。传统的访问控制挡不住 agent 滥用合法权限,监控需要考虑那些靠持久性而非漏洞利用来得手的攻击


最适合应对这场变化的组织,不一定是 AI 最先进的那些。而是基本功足够扎实,以至于 AI 辅助扫描一上来就找不到几个 bug 的那些,以及从第一天就按「假设已被攻破」来设计 agent 部署架构的那些


三条原则


永远不信任,始终验证。 每个访问请求都必须经过认证和授权,无论来源。来自企业内网的请求和来自外部 IP 的请求,接受同等级别的审查


假设已被攻破。 在设计系统时就预期攻破会发生。与其把精力集中在防止入侵上,不如限制攻击者能造成的损害。按身份分段,实施细粒度访问控制,确保攻破一个系统不会获得对其他系统的访问


最小权限。 只授予完成特定任务所需的最低访问权限。数据库管理员不需要访问邮件服务器。通过限制每个身份能访问的范围,组织可以控制单次攻破的爆炸半径(blast radius)


设计测试:不可能,还是只是麻烦


评估任何控制措施时,问一个问题:这是让攻击变得不可能,还是只是让攻击变得更麻烦?


那些价值来自摩擦而非硬性屏障的缓解措施,包括额外的跳板跳转、速率限制、非标端口、基于短信的 MFA,在面对能大规模碾过麻烦步骤的对手时会大幅失效。Agent 化的攻击者有无限耐心,每次尝试的成本接近于零


能通过这个测试的控制措施有一个共同模式:硬件绑定的凭证、会过期的 token、密码学身份、以及根本不存在的网络路径(而不是只是不方便的路径)。拿不准的时候,优先选择移除能力的控制,而不是限流能力的控制


Part I:自主系统的安全考量


Agent 式 AI 引入了现有安全模型设计时没考虑到的能力。传统软件执行预定义的逻辑,agent 系统不一样,它们以不同程度的自主性执行多步操作


Agent 系统有什么不同


无人值守执行Agent 不需要人在每一步批准就能执行操作。一个做研究的 agent 可能搜索网页、综合信息、产出报告,全程没有人工审核。被操控的 agent 能以机器速度造成伤害


工具访问Agent 可以与 API、数据库、文件系统和外部服务交互。这包括 MCP(Model Context Protocol)。一个被攻破的 MCP 栈可能导致数据窃取、恶意代码执行和破坏


决策能力Agent 需要解读指令并选择如何完成目标。一条对人类来说看起来无害的指令,可能被 agent 解读为能实现完全不同结果的方式


上下文持久化Agent 可以在会话间维持记忆。记住之前的交互让 AI 助手更能干,但也产生了新的数据保护需求


多 agent 协作Agent 可以与其他 agent 通信。这种信任关系让攻击者可以攻破一个 agent 然后横向移动,到达初始目标无法直接访问的系统


两个新概念


爆炸半径(blast radius): 衡量出问题时的潜在损害范围。只读访问单个数据库的 agent,爆炸半径很小。有云基础设施管理员权限的 agent,爆炸半径巨大。安全投入应该匹配这个暴露程度


最小代理权(least agency): 是 OWASP 造的新术语,把最小权限原则延伸到了 agent 应用。最小权限约束的是用户和系统能访问什么,最小代理权走得更远,限制每个 agent 工具能做什么、多频繁、在哪里。比如:数据库工具只拿到只读查询权限,邮件摘要工具没有发送/删除权限


合规要求


医疗、金融、政府等受监管行业面临的特定要求,agent 部署也必须满足。美国、英国和澳大利亚政府已经发布了 Zero Trust 指南,美国要求所有联邦机构在 2027 年前采用 Zero Trust


Part II:Agent 系统面临的当前威胁


OWASP 识别的当前威胁包括提示注入、工具和资源劫持、身份与访问权限滥用、记忆和上下文投毒、以及供应链风险


提示注入与指令操控


直接注入: 攻击者构造输入来覆盖系统指令。手段包括显式指令覆盖、Base64 等编码方案绕过过滤器、以及对人类毫无意义但能影响模型输出的对抗性后缀。研究显示算法化方法可以达到 100% 攻击成功率,生成的提示可以跨模型家族迁移


间接注入: 攻击者把恶意指令嵌入 agent 会处理的外部数据源,比如网页或邮件。Microsoft Research 确认,LLM 无法可靠地区分信息性上下文和可执行指令。 用户永远看不到恶意载荷,agent 把它当成合法请求执行了


工具和资源滥用


拥有工具访问权的 agent 可以被操控为恶意使用这些工具,即使在授权权限范围内。传统的访问控制挡不住这种攻击


工具中毒: 攻击者入侵 MCP 工具描述符、schema 或元数据。第一个有记录的野外恶意 MCP 服务器冒充了合法邮件服务,暗中复制了所有发出的邮件


工具链攻击: 攻击者骗 agent 把合法工具以有害顺序组合,比如把内部 CRM 工具和外部邮件工具串联来窃取客户数据。因为每条命令都通过可信二进制文件在有效凭证下执行,主机端监控看不到恶意软件


资源耗尽: 循环放大让 agent 反复调用高成本 API,造成拒绝服务或账单飙升


身份与权限滥用


无范围权限继承: 高权限的管理 agent 委派任务时没做最小权限约束,把完整的访问上下文传给了本应权限有限的工作 agent


被攻破的低权限 agent 向高权限 agent 转发看起来合法的指令,后者直接执行而没有验证原始用户的意图。当 agent 常规性地协调和委派时,这个「困惑代理人」问题会被放大


基于记忆的权限留存: Agent 缓存凭证或密钥用于上下文复用但没有做好记忆分段。攻击者可以提示 agent 用之前安全会话中缓存的密钥执行操作,跨会话边界提升权限


供应链和依赖风险


和静态的软件供应链不同,agent 生态系统经常在运行时组合能力,动态加载外部工具和 agent 角色


模型供应链风险 包括被投毒的权重和污染的微调数据引入的后门。Anthropic 研究表明,只需 250 个恶意文档就能在 6 亿到 130 亿参数的 LLM 中植入后门,且后门在安全训练(包括监督微调和 RLHF)后仍然存在


工具和框架供应链风险 影响 MCP 服务器、API 集成和 agent 框架。PyTorch 依赖混淆攻击演示了恶意包如何在安装过程中窃取 SSH 密钥。安全研究人员在主要平台上发现了约 100 个恶意 AI 模型


大多数软件供应链主要是开源的,大多数开源项目没有 SLA。用 OpenSSF Scorecard 评估依赖健康度。让前沿模型看看你的 lockfile 问哪些依赖重叠,通常一小时就能发现值得做的整合


记忆和上下文投毒


植入到助手记忆中的恶意指令可以危害当前和所有未来的会话。 Agent 在初始注入之后很久仍在为攻击者的目标服务


RAG 投毒: 通过被投毒的数据源向向量数据库注入恶意数据。Agent 检索到被污染的上下文后,产出错误答案或执行针对性载荷


共享上下文投毒: 利用多租户环境中复用或共享的上下文。长期记忆漂移更微妙:摘要或同伴 agent 的反馈逐步偏移存储的知识,因为没有单个改变看起来是恶意的,很难检测


逐个追踪威胁让你始终处于被动。下一节展示 Zero Trust 原则如何提供一个更持久的基础


Part III:将 Zero Trust 应用到 Agent 服务


本文档的剩余部分是实施指南。安全架构师和工程师应该逐步过一遍分级表格和工作流章节,安全负责人可以把前面的内容当简报文档用


原则按三个能力等级呈现:


Foundation 中小型团队的起步点。AI 加速攻击已经抬高了 Foundation 的地板:短命 token、密码学身份、基于身份的隔离和自动化初步分诊现在是入门要求


Enterprise 大多数有规模部署的组织应该瞄准的目标


Advanced 高度监管行业、国家安全应用、或攻破带来严重后果的场景


每个等级建立在前一个之上。预期 Advanced 会随领域演进变成 Enterprise 标准,Enterprise 变成 Foundation


Agent 身份与认证


身份和认证构成所有其他安全能力的基础。没有可验证的身份,你无法执行访问控制、维护审计追踪、或将动作归因到具体的 agent


[翻译] AI Agent 的 Zero Trust 框架|Anthropic 安全白皮书

Agent 身份与认证三级框架(Foundation / Enterprise / Advanced)


唯一标识符单独来看只是贴标签。Foundation 级别现在要求这些标识符有密码学根基。静态 API 密钥和共享服务账户密码是 AI 辅助攻击者最先找到的东西,即使在 Foundation 级别也不是合法入口


如果你现在在用带轮换策略的 API 密钥,把它当作已知缺口来对待。轮换一个可以从 lockfile 里 grep 出来的凭证,对 AI 辅助攻击者来说提升的成本微乎其微


访问控制和权限管理


即使完美认证的 agent,在被授予过多权限时也会造成损害。授权层执行最小代理权


[翻译] AI Agent 的 Zero Trust 框架|Anthropic 安全白皮书

访问控制与权限管理三级框架


最低限度,agent 只应该拥有与其角色相关的权限。邮件起草 agent 需要邮件权限,不需要访问财务部门的文件共享


沙箱执行限制了被攻破的 agent 能触达的范围。对处理网页内容、文档或任何不可信输入的 agent 来说,沙箱应该被视为必需而非愿景


Pro-tip


Claude Code 支持默认拒绝权限、沙箱执行带 OS 级隔离、写访问限制在项目目录内、托管设置让管理员强制执行组织范围策略


可观测性和审计


访问控制防止未授权的动作。可观测性揭示实际发生了什么。在检测方面做其他投入之前,先度量两件事:驻留时间(异常发生到人类知晓的时长) 和 覆盖率(实际被调查的告警比例)


[翻译] AI Agent 的 Zero Trust 框架|Anthropic 安全白皮书

可观测性与审计三级框架


Pro-tip


Claude Code 支持 OpenTelemetry 指标追踪、云环境审计日志、复杂命令的自然语言描述、ConfigChange hooks 审计设置变更


行为监控与响应


可观测性捕获 agent 做了什么。行为监控判断这些动作是正常的还是可疑的


[翻译] AI Agent 的 Zero Trust 框架|Anthropic 安全白皮书

行为监控与响应三级框架


检测异常只有在你响应得足够快以控制损害时才有意义。自动化事件周围的事务性工作,不要自动化决策。 模型应该做笔记、捕获证据、起草事后报告。人类应该做遏制决策、披露决策和客户沟通决策


Pro-tip


Claude Code 的命令注入检测会标记可疑命令,即使匹配白名单模式。失败关闭匹配将未识别命令默认为需要手动批准


输入验证和输出控制


监控和响应在威胁出现之后捕获它们。预防在威胁开始之前就阻止它们


[翻译] AI Agent 的 Zero Trust 框架|Anthropic 安全白皮书

输入验证与输出控制三级框架


输入清洗不能从传统技术直接搬到 agent 上。SQL 注入有明确定义的模式和受限的输入字段,但 agent 的输入是自由形式的


Advanced 级别增加了聚光灯技术(spotlighting),利用已知 schema 帮助 LLM 区分系统指令和用户输入。宪法分类器(constitutional classifiers),Anthropic 的方法在测试中阻止了 95% 的越狱尝试


Pro-tip


Claude Code 支持输入清洗防止命令注入、命令黑名单默认阻止 curl/wget、隔离上下文窗口防止提示注入、网络请求审批对所有出站连接设门


完整性和恢复


当控制措施到位但仍发生攻破时,你需要已验证的配置和快速恢复


[翻译] AI Agent 的 Zero Trust 框架|Anthropic 安全白皮书

完整性、恢复与治理三级框架


在基础设施层面,把「启用自动更新」和「部署前验证签名」视为互补而非矛盾。来自可信供应商的签名更新应该自动通过,未签名的变更应该直接拒绝


技术控制只能执行治理定义的东西。没有清晰的策略,团队会在 agent 能做什么、出了问题谁负责等问题上做出不一致的决定。影子 AI 是特别的风险:员工在 IT 不知情的情况下采用 LLM 工具,绕过了框架中的所有控制


Pro-tip


Claude Code 通过托管设置在组织范围内强制执行安全策略。allowManagedPermissionRulesOnly 阻止用户自定义权限规则


Part IV:Agent 实施工作流


成功的 agent 实施需要一个定义清晰的、可重复的流程。每个阶段处理特定的安全控制,同时缓解已识别的威胁


Phase 1:识别需求


定义你需要满足什么监管要求、要达成什么运营目标、在什么约束条件下工作。在开始构建之前,让安全、法务、合规和业务利益相关者达成一致


Phase 2:管理供应链风险


AI 物料清单(AI-BOM): 将软件组成分析延伸到 AI 组件,追踪模型来源、训练数据集血统和微调参数。将 AI-BOM 整合到现有供应链安全流程中


用 OpenSSF Scorecard 自动评估每个依赖的安全健康度。审计依赖树的冗余。用可达性分析缩小修复范围。对安全评分差且无人维护的小型依赖,让前沿模型重新实现你实际使用的功能子集


在整个部署过程中对模型和软件签名。审查工具提供商的安全实践。你的第三方风险管理流程应该明确询问供应商如何为 AI 加速的漏洞利用时间线做准备


Pro-tip


自己运行/托管 MCP 服务器,在不可变平台上,在你验证了代码之后。自己做密码学签名,在将更新引入生产之前对更新执行同样的操作


Phase 3:定义 agent 边界


精确定义每个 agent 被允许做什么、什么时候应该升级到人工审批、以及出了问题后的爆炸半径


分配唯一身份每个 agent 实例需要一个唯一的、有密码学根基的标识符。没有独立身份,在事件中关联日志就变成了猜测


批准/禁止的动作文档化哪些动作被允许或禁止。一个被允许读取客户记录、总结信息和起草回复的 agent 有清晰的边界。一个有模糊权限「帮忙做客户服务」的 agent 没有


升级触发器高价值交易、敏感数据访问、外部方通信都可能需要审批。定义平衡安全和运营效率的阈值


范围限制限制 agent 只能访问其功能所必需的系统。限制提供给 agent 的账户的访问权限


识别爆炸半径如果 agent 或系统被攻破,会出什么问题?应用「不可能还是麻烦」测试


Pro-tip


有时候你可能只是想把一个 agent 的功能拆分成多个 agent。但每个 agent 必须有唯一 ID 和自己的访问凭证。如果你拆分成多个 agent 但给它们都用同样的凭证,你就没能分隔风险


Phase 4:防御提示注入


就像需要在数据库上做输入清洗一样,我们需要控制和清洗呈现给 agent 的信息


输入隔离: 将所有自然语言输入视为不可信。Microsoft 的聚光灯技术将间接注入攻击成功率从超过 50% 降到了不到 2%


宪法分类器: Anthropic 的方法在测试中阻止了 95% 的越狱尝试,过度拒绝率增幅很小


限制攻击面: 限制谁或什么可以与 agent 系统交互。如果系统可以限定为可信人员和资源,恶意行为者劫持你系统的能力将被大幅限制


Phase 5:保护工具访问


工具访问是 agent 部署中风险最高的面之一


工具白名单将 agent 限制在批准的工具内,默认拒绝。要在 agent 级别和 agent 外部两个层面控制。静态 API 密钥不适合用于工具认证,即使在 Foundation 级别


能力限制限制允许的工具能做什么。邮件工具可能被限制为只能阅读,发送能力需要单独授权


参数验证在执行前验证工具调用参数。参数验证应该在 agent 端和工具端都做


沙箱执行带受限网络访问和系统调用过滤的容器沙箱遏制被攻破工具的影响。速率限制是摩擦不是屏障


审批升级高风险工具调用暂停等待人工审核


Phase 6:保护 agent 凭证


静态 API 密钥、嵌入的凭证和共享的服务账户密码是 AI 辅助攻击者最先找到的东西。把它们当作已经被攻破来对待


短命凭证作为基线。 Token 以分钟而非天计过期。条件允许时用证书授权机构实施基于证书的身份


硬件绑定凭证。 对生产系统,凭证应该绑定到经过证明的硬件。抗钓鱼的双因素认证(FIDO2 或 passkeys)应该是人类认证环节的默认选项。基于短信的验证码不满足 Foundation 级别


凭证隔离。 确保每个 agent 实例有唯一凭证。凭证永远不应出现在代码或配置文件中


显式信任边界。 多 agent 系统需要显式的信任边界。Agent 在接受委派任务之前应该验证其他 agent 的身份和授权


JIT 访问和 ABAC。 只在需要时授予权限,使用后立即撤销。这被认为是高级 Zero Trust 实施和非常强的威胁缓解手段


Phase 7:保护 agent 记忆


记忆保护阻止攻击者污染 agent 上下文或从记忆存储中提取敏感信息。和针对单个会话的攻击不同,记忆投毒跨交互持续存在


记忆隔离: 在会话和用户之间强制严格的边界


上下文完整性验证: 在每次检索时验证持久化的上下文,不仅是存储时。将哈希存储在与记忆内容分离的防篡改日志中


上下文保留策略: 通过生存时间值和自动过期未验证的记忆,防止被投毒内容无限期保持活跃


Pro-tip


Claude Code 默认强制会话隔离。每个会话从全新上下文开始。检查点在每次编辑前捕获状态,支持通过 rewind 回滚。cleanupPeriodDays 控制本地转录的保留期


Phase 8:度量真正重要的东西


当 agent 系统作为黑盒运行时,你无法判断它们是在交付预期结果还是已被攻破


驻留时间和覆盖率在做其他任何事之前先度量这两个指标。这是 AI 自动化最有杠杆撬动的两个指标


可解释性你能否将任何 agent 动作追溯到其触发输入并解释 agent 为什么选择那个响应


行为一致性追踪 agent 动作是否与预期策略和模式一致。突然偏好不同工具的 agent 值得调查


检测速度度量团队多快能意识到 agent 行为异常。对关键系统的目标是一小时内检测到


安全团队应该能回答:如果一个 agent 失控了,我们能在一小时内知道吗? 如果答案不确定,基础控制需要更多工作


Part V:以自主威胁的速度运行防御运营


保护你部署的 agent 只是一半工作。另一半是让安全运营跑得足够快。当漏洞利用在补丁发布几小时内就出现时,需要几天的响应流程就太慢了


答案不是把人从环里移除,而是把人从事务性工作上移到决策上。 自动化证据收集、丰富、关联和文档。让人类做遏制决策、披露决策和客户沟通决策


在告警队列前面放一个模型


每条进入的告警在人类看到之前都应该得到一次自动化的初步调查。选一条已知高误报率的嘈杂规则,把前沿模型接入它的告警流,让它为每次触发产出结构化处理意见。和人类审查员对比两周。不要试图一次自动化整个队列


Agentic SOAR


今天的 SOAR 平台让安全团队能整合和协调独立的安全工具。下一代是 Agentic SOAR,增加了应对新情况的自适应能力,在几秒钟内直接应对恶意 AI 驱动攻击


按 MITRE ATT&CK 映射检测覆盖


知道你能检测哪些技术、不能检测哪些,比笼统地「改善检测」更有用。 优先覆盖横向移动和凭证访问。Atomic Red Team 是一个开源库,跑几个测试看看你现有的日志实际检测到了哪些,这是一个下午的练习


为五个同时发生的事件做桌面推演


标准推演假设周一出了一个关键 CVE。跑一个同一周出了五个的版本。 围绕电子表格和每周会议构建的工作流跟不上。为发现量的数量级增长做计划,在它发生之前排练


提前建立紧急变更程序


生产补丁的两周变更审批周期本身就是安全风险。下线一个服务、轮换一个凭证、阻断一条网络路径,提前决定谁能授权、多快能授权、需要什么证据。演练授权路径


对防御型 agent 也要验证


组织不应该盲目信任防御自动化,正如不应该盲目信任其他自主系统一样。 攻破防御型 agent 的攻击者会获得强大的能力。防御型 agent 应该运行在加固的环境中,以最小权限运行,自动响应需要人工审批高影响决策


从原则到实践


Agent 面临的威胁和传统 IT 不同。Zero Trust 提供了应对的框架


验证每个 agent 动作,授予最低必要权限,在攻破发生时控制损害。身份支持归因和访问控制。可观测性揭示发生了什么。行为监控检测异常。输入输出控制在边界阻止攻击。完整性保护支持恢复。防御运营以威胁的速度运行


跳过任何一项能力,攻击者就会利用那个缺口


从 Foundation 级别开始,但要认识到 Foundation 的地板已经被抬高了:短命 token、密码学身份、基于身份的隔离和自动化初步分诊现在是入门要求,不是愿景。随部署规模和风险增长系统性推进


对受监管行业,HIPAA、FINRA、GDPR、FedRAMP 和 EU AI Act 已经施加了与 Zero Trust 对齐的要求。合规截止日期在逼近,竞争压力意味着 agent 部署不会减速


合规截止日期是真的,威胁图景在变,事后加装控制比一开始就建好更贵。 这份白皮书给你的团队一个具体的起点


对架构师和工程师:从 Foundation 开始,验证你的控制,随部署规模推进等级。把「不可能还是麻烦」测试当作常设的设计评审问题。威胁会演化,你的防御也应该


文章来自于"赛博禅心",作者 "金色传说大聪明"。

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI工作流

【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!

项目地址:https://github.com/coze-dev/coze-studio


【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/付费

2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

3
RAG

【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。

项目地址:https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。

项目地址:https://github.com/langgenius/dify


【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。

项目地址:https://github.com/infiniflow/ragflow/tree/main


【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目

项目地址:https://github.com/phidatahq/phidata


【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。

项目地址:https://github.com/TaskingAI/TaskingAI

4
微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。

项目地址:https://github.com/InternLM/xtuner