全栈式创新——云计算平台如何加速企业部署生成式AI

10402点击 2023-12-25 12:06

打造负责任的AI

生成式AI将成为未来企业在竞争中优势的重要来源。企业现在面临的关键问题已经不是要不要上大模型，而是如何让大模型落地，为企业创造真正的价值。作为大数据、大算力催生的产物，大模型“天生长在云上”，大模型落地更是要取决于云服务的质量。

作为云计算和生成式AI的领军企业之一，亚马逊云科技在其 2023 re:Invent大会上公布了最新AI全栈式创新和配套工具包，目的是帮助更多企业利用生成式AI进行创新，从这些最新的创新实践中，我们也许能一窥生成式AI在企业应用中的最新趋势。

由于美国市场在生成式AI领域领先中国大概6-12个月，基础大模型赛道的竞争格局已经基本成型，更多的创新正在向应用/AI原生应用层汇聚，商业机构对AI的认知和接纳程度也相应更高。

美国企业界，特别是管理层的基本共识是，生成式AI将在未来几年对企业的竞争力产生颠覆性的影响。因此越来越多的企业，特别是资金和技术实力比较雄厚的大企业/机构开对生成式AI进行落地的实验。

本次大会就透露了一些最新的信息，比如全球最大的另类资产投资和管理公司黑石（BlackStone）正在与亚马逊云科技和向量数据库提供商Pinecone合作，推出基于生成式人工智能的解决方案，以增强投资团队能力。

酒店集团万豪国际正在与亚马逊云科技、咨询公司德勤和软件供应商Palo Alto Networks合作，根据万豪国际的首席信息安全官Arno Van Der Walt的说法：更安全地利用人工智能提供数字客房服务。

不过对于大多数企业，向生成式AI转型的过程可能涉及高昂的时间和技术成本，还可能面对安全和隐私方面的挑战。为了帮助更多的客户解决转型挑战，尽量降低大模型的应用成本，亚马逊云科技在今年的re:Invent大会上也发布了其针对生成式AI的全栈式创新，涵盖了底层负责训练和推理的基础设施层、中间的模型工具服务层以及上层生成式AI应用层，目的是在全栈各个层面帮助企业落地大模型。

01 基础设施层：联合Nvidia打造H200超算

大模型训练和推理都需要巨大的算力支持，基础算力层的能力也决定了大模型的能力，重要性不言而喻。

大会上的一大亮点就是亚马逊云科技首席执行官Adam Selipsky与Nvidia首席执行官黄仁勋携手登台。两人首先回顾了亚马逊云科技和Nvidia的长期合作，13年前亚马逊云科技是全球提一个提供GPU算力的云服务商，如今亚马逊云科技已经部署了超过200万张Hopper架构的GPU（H100），相当于提供了3000台超算的算力。两家公司随后宣布将扩大合作，在亚马逊云科技上部署最新的Crace Hopper——H200 芯片。

除了最先进的GPU，还需要好的分布式计算架构才能形成强大算力。亚马逊云科技和Nvidia宣布将联手打造全球首个基于H200的云上超级计算机，在亚马逊云科技 EC2 UltraCluster的帮助下，将集成最多16385张H200提供的算力。这将可以轻松满足万亿参数级别大模型的预训练。

此外，亚马逊云科技还发布了最新的机器学习芯片Trainuim2，据悉Trainium2芯片比第一代的训练速度提高了四倍。它能够部署在最多100,000个芯片的EC2 UltraClusters中，从而可以在更短的时间内训练大型语言模型和基础模型，同时将能源效率提高近两倍。大模型超高的能耗一直是寻求碳中和的企业必须面临的问题，而Trainuim2将有效地帮助他们减少应用大模型带来碳足迹。

02 模型工具服务层：宣布支持几乎所有主流开源大模型

有了足够的算力，还需要对模型进行训练、微调和继续训练。而亚马逊云科技的生成式AI服务Bedrock也宣布推出新的功能。其中之一是为客户提供更多的模型选择，用于构建和扩展生成式AI应用。这包括来自Anthropic、Cohere、Meta和Stability AI的新增模型。例如Anthropic的Claude 2.1提供了业界领先的 200K token上下文输入创库，同时还提高了推理准确性。Anthropic CEO在re:Invent 2023上介绍，Claude 2.1将开放式对话中的幻觉减少了 50%，虚假陈述减少了2倍，而这两种情况都是企业采用人工智能的核心障碍。亚马逊云科技今年还与Anthropic达成战略合作，Amazon Bedrock的客户还将享有独家早期使用权，体验其他地方无法使用的Claude定制和微调模型功能。

全栈式创新——云计算平台如何加速企业部署生成式AI

很多企业面临的一个问题是如何选择自己的基础模型，亚马逊云科技还针对这一痛点，“贴心地”推出了Bedrock模型评估服务。

模型评估包含自动评估和人工评估两类。在自动评估中，开发人员可以使用Amazon Bedrock控制台，选择他们想要评估的模型，例如Amazon Llama、Amazon Claude 2或Amazon Stable Diffusion等。Amazon Bedrock可以评估模型在摘要总结、文本分类、问答和文本生成等任务中的性能指标，如稳健性、准确性和安全性等。

在评估过程中，亚马逊云科技提供测试数据集，但企业也可以将自有数据引入基准测试平台，以更好地匹配自身业务场景，选择最适合的模型。至于人工评估，客户有选择与亚马逊云科技评估团队合作或与自己团队合作的权利，以确保对模型性能进行全面审查和评估。

大会还介绍了亚马逊云科技的Amazon Titan大模型系列，可以让企业根据业务场景选择合适的模型服务。以电商为例，客户可以先用文本嵌入模型将服务用语和售后政策转化为向量，方便客服人员进行模糊搜索。

客户还可以将产品比如皮鞋的细节，包括材料和功能转化为Prompt输入到到Amazon Text Express模型中，以生成详细的产品描述。模型还可以为我们生成多种多样的试用场景，让产品描述更贴近生活，客户更容易产生共鸣。

营销部门需要为这款鞋生成一系列的搜索关键字，到搜索引擎购买关键词，给网站带来更好的流量。这种简单的任务，显然可以用Amazon Text Lite小模型即完成了任务，对比调用较大型的模型，消耗更低的成本。

而有了Amazon Titan多模态嵌入模型，企业可以把这款新鞋子的图片和文字描述一起转成向量存起来到向量数据库里。这样假设有一个客户在大街上看到了其他人穿这双鞋子，他只需要拍下照片，不需要认识品牌就可以检索到这双鞋子。

最后，网站设计师需要为这款鞋进行营销投放定制宣传的图片，把比如给产品增加一个背景。Amazon Titan Image Generator可以用自然语言生成这样的图像。

全栈式创新——云计算平台如何加速企业部署生成式AI

03 生成式AI应用层：智能助理Amazon Q问世

作为本届re: Invent的重头戏，亚马逊云科技隆重发布了自己的企业生成式AI应用：AI助手Amazon Q。

亚马逊云科技首席执行官Adam Selipsky的介绍，员工可以使用亚马逊 Q 进行对话、解决问题、生成内容、获取洞察，并通过无缝地利用企业信息库、代码、数据和企业系统来进行决策。

Amazon Q 可以快速连接到企业业务数据、信息和系统，这样员工就可以进行定制对话、解决问题、生成内容并采取与您的业务相关的行动。Amazon Q 根据提供的材料和知识生成答案和洞察，并附上源文档的参考文献和引文。

例如新入职的员工可以向Amazon Q提问：“在哪里可以找到最新的品牌logo使用指引？”，Amazon Q 无需在多个系统之间切换即可找到您需要的内容。由于 Amazon Q 了解后续问题，因此您可以继续寻求更多帮助，例如，“在哪里可以找到我们logo的不同颜色组合？”，Amazon Q 将理解前一个问题的背景，揭示相关信息的位置。

对企业来说，Amanzon Q对于管理和工作流重构都意义非凡。许多企业都面临着相似的挑战：尽管企业拥有大量散布在多个文档、系统和应用程序中的信息，但无论是财务、人力资源、营销还是销售，每个组织的员工都花费大量时间在日常工作中搜寻内部信息、整理数据、编写报告和制作演示文稿，还需要根据不同受众进行内容调整。

Amazon Q 目前提供 40 多个内置连接器，可以连接到常用的企业应用程序和文档存储库，包括 Amazon Simple Storage Service（Amazon S3）、Salesforce、Google Drive、Microsoft 365、Gmail、Slack和 Zendesk等。

04 打造负责任的AI

对于企业级应用，生成式AI的安全和隐私保护一直都是企业关注的重中之重，本次大会也宣布了亚马逊云科技在这些领域的新举措。

例如正在开发中的Amazon Bedrock Guardrail，可以让企业定制人工智能使用安全策略，从而保障用户与大模型应用之间的安全互动。

企业可以将防护措施应用于Amazon Bedrock中的所有大型语言模型，包括经过精调的模型和Agent，确保企业客户能够在安全的前提下进行创新。

Amazon Guardrail服务包含几个安全策略功能：

拒绝主题：企业可以使用简短的自然语言描述来定义在AI应用的上下文中不期望出现的一组主题。例如，银行可以配置其大模型不向客户供投资建议。

内容过滤器：企业可以配置过滤器来屏蔽仇恨、侮辱、性和暴力等有害内容。尽管许多大语言模型已经提供内置保护功能，以防止生成不期望和有害的回复，但GuardRail为企业提供了额外的控制，根据企业使用案例和负责任的AI政策，将生成时AI和用户的互动过滤到所需程度。更高的过滤强度对应着更严格的内容控制。例如电子商务网站可以让AI不使用仇恨言论或侮辱性语言。

个人信息屏蔽：企业可以选择一组个人身份信息，如姓名、电子邮件地址和电话号码，在生成的大型语言模型响应中进行屏蔽，或者当用户输入包含个人身份信息，系统可以进行阻止。例如公用服务公司可以从客户呼叫记录中隐去客户的个人身份信息。

利用AI制作虚假信息也是企业关注的风险点，Amazon Titan Image Generator产生的所有图像将自动包含隐形水印。亚马逊云科技希望找到一种方式来标记图像是由AI创建的，特别是由自家大模型制作的，这种标记不会影响视觉效果，没有延迟，并且无法被裁剪或压缩去除。添加隐形水印，可以帮助企业解决信息真实性和AI内容溯源等相关风险问题。

从全栈式搭建生成式AI技术，到负责任的使用人工智能，可以看到亚马逊云科技正在开发一站式、端到端的生成式AI企业服务，从而大幅降低AI落地门槛。

生成式AI的普惠时代已来。从对最新技术发展的梳理中，我们也可以总结出大模型落地需要关注的创新与应用挑战。对于那些志在利用AI提升竞争力的企业，无论处于哪个行业、那个发展阶段，这些要素都值得管理者关注。

文章来自于微信公众号 “哈佛商业评论”（ID：hbrchinese)，作者 “HBR-China”

关键词: AI云算力 , 亚马逊AI云

AITNT资源拓展

根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考

AI工作流

【开源免费】字节工作流产品扣子两大核心业务：Coze Studio（扣子开发平台）和 Coze Loop（扣子罗盘）全面开源，而且采用的是 Apache 2.0 许可证，支持商用！
项目地址：https://github.com/coze-dev/coze-studio

【开源免费】n8n是一个可以自定义工作流的AI项目，它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址：https://github.com/n8n-io/n8n
在线使用：https://n8n.io/（付费）

【开源免费】DB-GPT是一个AI原生数据应用开发框架，它提供开发多模型管理（SMMF）、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL（智能体工作流编排）等多种技术能力，让围绕数据库构建大模型应用更简单、更方便。
项目地址：https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file


【开源免费】VectorVein是一个不需要任何编程基础，任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤，并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址：https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用：https://vectorvein.ai/（付费）

智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的（AI Agents）项目。用户创建的智能体能够自动执行各种任务，从而让AI有步骤的去解决实际问题。
项目地址：https://github.com/Significant-Gravitas/AutoGPT

﻿【开源免费】MetaGPT是一个“软件开发公司”的智能体项目，只需要输入一句话的老板需求，MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色，包括产品经理 / 架构师 / 项目经理 / 工程师，MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址：https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

RAG

【开源免费】graphrag是微软推出的RAG项目，与传统的通过 RAG 方法使用向量相似性作为搜索技术不同，GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址：https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG，Agent，模型管理等一站式AI开发的工具平台，并且项目方一直持续维护。其中在任务编排方面相对领先对手，可以帮助研发实现像字节扣子那样的功能。
项目地址：https://github.com/langgenius/dify

【开源免费】RAGFlow是和Dify类似的开源项目，该项目在大文件解析方面做的更出色，拓展编排方面相对弱一些。
项目地址：https://github.com/infiniflow/ragflow/tree/main

【开源免费】phidata是一个可以实现将数据转化成向量存储，并通过AI实现RAG功能的项目
项目地址：https://github.com/phidatahq/phidata

【开源免费】TaskingAI 是一个提供RAG，Agent，大模型管理等AI项目开发的工具平台，比LangChain更强大的中间件AI平台工具。
项目地址：https://github.com/TaskingAI/TaskingAI

AI搜索

【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架，其性能可与 Perplexity和ChatGPT-Web相媲美。
项目地址：https://github.com/InternLM/MindSearch
在线使用：https://mindsearch.openxlab.org.cn/

【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费，搜索结果包含文本，图片，视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目，测试搜索结果最好。
项目地址：https://github.com/miurla/morphic/tree/main
在线使用：https://www.morphic.sh/

微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台，可以对大语言模型（LLM）和多模态图文模型（VLM）进行预训练和轻量级微调。XTuner 支持多种微调算法，如 QLoRA、LoRA 和全量参数微调。
项目地址：https://github.com/InternLM/xtuner

prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法，编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词，进而高质量的帮助用户通过AI解决问题。
项目地址：https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用：https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0