引言:AI大模型,并不是一个赢家通吃的市场。
自OpenAI在2022年发布ChatGPT以来,无论是科技巨头还是初创公司,各个玩家可以说是纷纷加大投入,试图在模型性能上超越彼此。
似乎追求单一、性能卓越的AI大模型已然成为一种趋势,各类Benchmark上的夺冠也好似一张得到市场认可的入场券。
然而在如此打法成为主流的同时,一个在AI大模型时代以来一直看似低调,也鲜有大声量地高喊“大模型性能第一”的科技巨头,却在时隔两年多之久,以截然不同的方式在大模型市场里惊艳亮相。
它就是云计算一哥——亚马逊云科技。
对于亚马逊云科技在AI大模型时代的定位,目前有一种非常贴切的比喻,叫做“沉睡的雄狮”。
之所以如此,是因为亚马逊云科技此前几乎是以“工厂模式”来推动大模型的发展,在业界声响最大的便是集成各路大模型的Amazon Bedrock。
即便在早期有发布过自研大模型Titan,但有一说一,似乎也是在大模型飞速迭代的浪潮中被淹没。
然而,正当大众以为亚马逊云科技在AI大模型时代会持续扮演一个“工厂”角色之际,就在前不久自家的年度盛宴re:Invent 2024中,它却高调发布了全新的基础模型——Amazon Nova系列。
而且是一口气六款模型,涵盖文本对话、图片生成和视频生成,并且也罕见地把与各类模态主流玩家的PK测评成绩直接亮了出来。
以视频生成模型Amazon Nova Reel为例,效果是这样的:
于是乎,为何在沉寂两年后才会有此动作?亚马逊云科技的打法又是否能符合市场发展?……
种种问题,亟待回答。
其实在今年亚马逊云科技的re:Invent中,若是一定要提炼一个关键词,那么Choice(选择),无疑就是最抢眼的那一个。
展开这个关键词,则正是“云计算一哥”在AI大模型时代下的打法:
会做选择,比拥有单一强大的大模型更为重要。
这是因为在亚马逊云科技看来,大模型市场并不是一个赢家通吃的市场;这就与其它公司形成了鲜明对比。
然而,亚马逊选择了一条不同的道路,通过其Bedrock等工具支持来自多个提供商的不同模型,而不是仅仅专注于构建自己的强大模型。
而这种背后蕴含“没有一个模型可以一统天下”的模式似乎也正在被市场所接纳。
根据Menlo Ventures的报告,公司通常在其AI服务中使用3个或更多的基础模型,根据不同的用例或结果路由到不同的模型。
这种趋势表明,即使是市场份额佼佼者的OpenAI,也面临着来自其他采用多模型策略的公司的挑战。
同样是根据Menlo Ventures的报告,一个较有说服力的数据是这样的:
采用亚马逊云科技模式的Anthropic在AI模型市场的份额翻倍至24%,而OpenAI的份额从50%下降到34%。
不过与此同时,自身拥有先进的AI大模型同样也有助于亚马逊云科技吸引更多的AI开发者。
虽然早期亚马逊云科技所推出Titan并没有在大模型圈里泛起太大的浪花,但这一次的Nova系列,确实是以其效果和实力博取了不小的关注。
而这一切的背后,依旧是贯彻亚马逊云科技的根本问题,即客户有所需要。
因此,亚马逊云科技在大模型时代下的“AI步法”就非常清晰了——
为客户提供“多快好省”的选择权,而不是“一统天下”的市场主导权。
那么接下来的一个问题是:
就在今天刚结束的re:Invent 2024中国行全国巡展北京站活动中,亚马逊云科技大中华区产品总经理陈晓建对这一问题做了再次的回顾。
在短短90分钟的主题演讲中,露出的“AI可选项”多达30多个,平均下来就是每三分钟一个!
纵观整场活动,最直观的感受,就是这些回顾的“全新发布”涵盖了整个生成式AI的全周期——
从最底层的基础设施,到中间的模型服务,再到顶层的AI应用,是属于全栈的那种。
而之所以如此,陈晓建在现场做出了如下解释:
我们不仅在云的核心服务层面持续创新,更在从芯片到模型,再到应用的每一个技术堆栈取得突破,让不同层级的创新相互赋能、协同进化。
我相信,只有这样全栈联动的大规模创新才能真正满足当今客户的发展需求,加速前沿技术的价值释放,助力各行各业重塑未来。
“全新发布”数量虽然惊人,但按照生成式AI各层级来看脉络也是较为清晰,可以分为五个大亮点:
那么接下来,我们就来再次深入回顾下今年re:Invent中的那些高光时刻。
首先,我们先来看下“AI推理”部分的产品,或许也是大家最感兴趣、最有感知的一个内容——大模型。
亚马逊云科技所发布的新款自研基础模型,名曰Amazon Nova,是有一点点震撼在身上的。
整体来看Amazon Nova共有四个“杯型”,它们分别是:
其中一大亮点便是成本大幅降低。
据了解,在各自智能类别中,Amazon Nova Micro、Lite和Pro应用成本比“模型工厂”Amazon Bedrock中表现最佳的模型至少降低75%,同时也是Amazon Bedrock中对应类别速度最快的模型。
前三者已经上架亚马逊云科技的Amazon Bedrock,而Premier版本则将于2025年第一季度推出。
除此之外,还有Amazon Nova Canvas,主打的是图像生成,用官方的话来说,是达到了“State-of-the-art”(最先进)的水平。
在现场,陈晓建也展示了与DALL·E 3和Stable Diffusion Large 3.5的评估测试上的比较,图像质量等维度上均胜出。
在图像生成之后,亚马逊云科技还发布了视频生成模型——Amazon Nova Reel。
据了解,目前6秒钟时长的视频生成已经正式可用,2分钟版本的也在路上了。
同样的,Amazon Nova Reel与Runway家的Gen-3 Alpha之间的评测比试结果:视频质量胜率61.4%、视频连贯性胜率71.6%。
但这还不算完,Amazon Nova的下一步也已披露——
不仅要Speech-to-Speech,更要Any-to-Any!
一切皆可生成,是值得期待一波了。
而作为承载它们的“模型工厂”Amazon Bedrock,这一次也有不少的升级动作。
首先就是在模型的选择上,新增了多个choices,例如首家提供Luma AI和poolside模型,以及更新的Stability AI最新模型等。
其次,全新发布的Amazon Bedrock Marketplace,可以为客户提供100多个热门、新兴及专业模型。
还有Amazon Bedrock Knowledge Bases,现在支持可以支持GraphRAG等知识库功能增强数据利用能力。
在性能方面,Bedrock还推出了低延迟优化推理,由此,用户可以在使用最先进的大模型基础上,还享受卓越的推理性能。
值得一提的是,Llama 405B和Llama 70B低延迟优化版本,在亚马逊云科技上展现出超越其他云提供商的出色表现。
最后,通过自动推理检查功能和多智能体协作等创新,进一步增强AI安全性并推动智能体发展。
Amazon Q Developer则是引入了三款先进的智能体。
它们能够自动执行单元测试、生成文档和进行代码审查,同时通过与GitLab的深度整合,拓宽了应用范围。
此外,它还推出了新的转型特性,旨在加快Windows.NET、VMware和大型机工作负载的迁移与现代化进程,有效减少转型周期和成本。
同时,Amazon Q Business和Amazon Q in QuickSight的洞察力得到了加强,简化了复杂工作流程自动化的实现方法。
说完大模型,我们再来看下亚马逊云科技的“老本行业务”——云计算。
这次升级主要围绕三大核心领域展开:计算(Compute)、存储(Storage) 和数据库(Database)。
每一项都可以说是展现出了前所未有的性能提升与成本优化。
在计算(Compute)层面,亚马逊云科技推出了性能全面升级的Amazon EC2 Trn2实例。
Trn2实例搭载第二代Trainium芯片(Trainium2),相比上一代Trn1,性能提升如下:
更重要的是,Trn2实例的性价比提升显著,相比传统GPU实例(P5e和P5en)高出30-40%,大幅降低了算力成本。
对于超大规模计算需求,亚马逊云科技还推出了Trn2 UltraServer。
每台UltraServer集成了64颗Trainium2芯片,并通过NeuronLink高速互联实现2TB/s带宽和1微秒级延迟。
这款产品为超大规模AI模型训练提供了理想的算力平台。
除此之外,在芯片层面上,亚马逊云科技宣布将在2025年推出Trainium3芯片。
据悉,Trainium3将采用3纳米工艺制造,提供两倍于Trainium2的计算能力,并提升40%的能效。
在存储(Storage)层面,亚马逊云科技发布了专为表格数据设计的Amazon S3 Tables,性能和效率再次升级。
Amazon S3 Tables引入了一种创新的存储解决方案,专门针对表格数据优化,并兼容Amazon Athena、Amazon EMR以及Apache Spark等主流查询工具,以便用户能够便捷地执行数据查询操作。
作为S3的第三种存储类别,表存储桶与通用存储桶和目录存储桶相辅相成,它被设计为一个分析型数据仓库,适合存放多种模式的Iceberg格式表格。
S3 Tables在性能上相较于传统的自管理表格存储有显著提升,查询速度可提高至3倍,事务处理速率可达10倍,且享有全面托管的服务带来的操作便利。
在数据管理中,元数据的作用日益凸显,例如,手机中存储的大量照片能够通过元数据快速定位,使用自然语言即可迅速检索到特定照片。
为满足此类需求,亚马逊云科技推出了Amazon S3 Metadata的测试版,旨在提供更加智能和高效的元数据管理功能。
Amazon S3 Metadata 提供了一种智能化、便捷的元数据管理方案,实现了近乎实时的元数据更新,帮助用户高效地组织、识别和利用S3数据,支持业务分析和实时推理等应用场景。
该功能支持对象元数据管理,既涵盖系统生成的详细信息(如文件大小和来源),也允许用户自定义元数据。用户可以通过标签为对象附加额外信息,如产品SKU、交易ID或内容评级,进一步提升数据的分类与检索效率。
此外,这些元数据信息被无缝整合到 S3 Tables 中,进一步强化了数据的管理与分析能力。
最后一层,便是数据库(Database)了。
亚马逊云科技发布了新型无服务器分布式数据库Amazon Aurora DSQL,旨在解决传统数据库在扩展性和性能方面的挑战,目前可以实现:
与此同时,Amazon DynamoDB global tables也增加了多区域强一致性支持,进一步增强了其分布式数据库服务能力。
此次发布的最后一部分,便是分析板块。
亚马逊云科技所发力的点,便是其一站式数据、分析与AI解决方案中心——新一代Amazon SageMaker。
新一代SageMaker的核心是SageMaker Unified Studio。
这是一个单一的数据和AI开发环境,它整合了Amazon Athena、Amazon EMR、AWS Glue、Amazon Redshift、Amazon Managed Workflows for Apache Airflow (MWAA)以及现有的SageMaker Studio中的工具和功能。
其次是Amazon SageMaker Lakehouse,可以统一Amazon S3数据湖、Amazon Redshift数据仓库和第三方及联合数据源。
除此之外,还包括Amazon SageMaker HyperPod的新训练配方功能、灵活训练计划和任务治理功能,以及在Amazon SageMaker中使用亚马逊云科技合作伙伴的热门AI应用。
这些功能将帮助客户更快开始训练流行模型,通过灵活训练计划节省数周时间,并将成本降低高达40%。
以上就是今年亚马逊云科技给予大模型时代客户们的种种新的选择了。
而这种“以客户为中心,逆向工作(work backward)”为基因的云计算巨头,还将以“提供选择权”的方式在这个时代给我们带来怎样的惊喜,是值得期待一波。
文章来自微信公众号“量子位”,作者“允中”
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。
项目地址:https://github.com/labring/FastGPT
【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址:https://github.com/microsoft/graphrag
【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。
项目地址:https://github.com/langgenius/dify
【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。
项目地址:https://github.com/infiniflow/ragflow/tree/main
【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目
项目地址:https://github.com/phidatahq/phidata
【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。
项目地址:https://github.com/TaskingAI/TaskingAI