人工智能热潮催生“GPU即服务”

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
人工智能热潮催生“GPU即服务”
6598点击    2025-02-16 11:13

人工智能热潮催生“GPU即服务”

图片来源:spectrum.ieee


由于对运行 AI 模型的需求激增,对算力的需求也随之激增。世界各地的公司都在努力寻求运行更高级 AI 模型所需的 GPU。虽然 GPU 并非运行 AI 模型的唯一选择,但它们已成为首选的硬件,因为它们能够有效地同时处理多项操作,而这是开发深度学习模型时的一个关键特性。


但并不是每个人工智能初创公司都有足够的资金投资于运行尖端模型所需的大量GPU。对一些公司来说,外包是更好的选择。这导致了一种新的业务模式兴起:GPU 即服务 (GPUaaS)。近年来,像 Hyperbolic、Kinesis、Runpod 和 Vast.ai 这样的公司纷纷涌现,为需要计算能力的客户提供远程服务。


虽然亚马逊(Amazon)或微软(Microsoft)等提供云计算服务的科技巨头拥有自己的基础设施,但像Kinesis这样规模较小的初创公司也已经开发出了充分利用现有闲置计算的技术。


“企业需要算力。他们需要训练模型或运行应用程序。但是,他们不一定需要拥有或管理服务器,”Kinesis联合创始人比娜•希马尼(Bina Khimani)表示。


研究表明,超过一半的现有GPU在任何给定时间都没有被使用。无论是个人电脑还是庞大的服务器群,都没有充分利用大量的处理能力。Kinesis所做的就是识别全球服务器中的空闲算力(包括GPU和CPU),并将它们编译成一个单一的计算源供公司使用。Kinesis 与愿意出售其未使用算力的大学、数据中心、公司和个人合作,通过安装在其服务器上的特殊软件,检测闲置的处理单元,并将其提供给客户临时使用。


比娜•希马尼说:“在Kinesis,我们开发了一种技术,可以将零散的闲置算力汇集在一起,并将其重新用于无服务器的、自动管理的计算平台。”Kineesis的客户甚至可以选择他们想要的GPU或 CPU来自哪里。


人工智能的发展速度超过了服务器的发展速度。


GPUaaS正在填补人工智能行业日益扩大的空白。随着学习模型变得越来越复杂,它们需要更多的功能和基础设施,以便能够越来越快地处理信息。换句话说,没有足够数量的GPU,大型人工智能模型无法运行,更不用说改进了。去年10月,OpenAI的首席执行官萨姆·奥特曼承认,他们面临着计算能力的限制,因此无法按照期望的速度发布产品。


同样在10月份,微软首席财务官艾米·伍兹在一次电话会议上告诉公司的投资者,对人工智能的需求“持续高于”他们的“可用容量”。


GPUaaS最大的优势是经济性。通过消除购买和维护物理基础设施的需要,它使公司无需投资服务器和IT管理,而是可以将资源用于改进他们自己的深度学习、大型语言和大型视觉模型。客户可以做到用多少GPU就支付多少钱,从而节省部署自己的服务器所带来的闲置计算成本。


像Kinesis这样的无服务器创业公司还声称比传统的云计算公司对环境更友好。该公司表示,利用现有的、未使用的处理单元,相比于为额外的服务器供电,可以大大降低能耗。在过去的五年里,由于人工智能消耗了大量的能源,像苹果和微软这样的大型科技公司的碳排放量飙升。作为回应,一些公司已经转向核能,以便为他们的服务器提供可持续的动力。Kinesis和其他新的初创公司提供了一种第三途径,在这种途径中,不需要插入更多的服务器。


希马尼说:“行业领导者都坚定地致力于可持续发展。随着对创新和效率的关注,他们可以优化现有的计算能力,毕竟这些计算能力已经处于活跃状态并在消耗能源了。”


对机器学习不断增长的需求和巨大的数据消耗正在将GPUaaS变成一个非常有利可图的科技领域。2023年,该行业的市场规模达到32.3亿美元;2024年,这一数字增长到43.1亿美元。预计到2032年,这一数字将增至498亿美元。


希马尼说:“人工智能行业正在迅速发展到下一个阶段,重点正在从建立和训练模型转向优化效率。客户越来越多地提出这样的问题,‘当训练一个新模型时,我们如何才能做到更有针对性,而不消耗需要大量计算和能源的海量数据?’”



文章来自 “ 神译局 ”,译者:Teresa


人工智能热潮催生“GPU即服务”


关键词: GPU , 算力租赁 , AI , 人工智能
AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI数据分析

【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。

项目地址:https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file

本地安装:https://www.deepbi.com/

【开源免费airda(Air Data Agent)是面向数据分析的AI智能体,能够理解数据开发和数据分析需求、根据用户需要让数据可视化。

项目地址:https://github.com/hitsz-ids/airda