ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
硅谷新公司SF Compute,AI算力的“Airbnb”
8121点击    2024-07-22 14:44

不知经常往旧金山城里跑的小伙伴,有没有在路边见过这样的广告:


“按周、天或小时租用H100芯片。3.2TB/s InfiniBand高速网络,k8s/Slurm开源系统,就是这种东西。”


下面还写了一排官网地址给你“撕”。



作为全世界生成式人工智能的火热据点,旧金山街道遍布的各类AI广告早已成为它的“城市特色”。可即便如此,这个“出租算力”的概念仍然很酷,而且是把高高在上的英伟达H100变得如此接地气,在AI圈内引起了一阵小波澜。


半年多过去,这家做算力生意的初创公司San Francisco Compute从名不见经传的“Underdog”来到台前。上周,Sam Altman亲弟弟Jack Altman主理的Alt Capital领投其1200万美元种子轮融资,让它的估值来到约5亿人民币(7000万美元)


一、AI算力市场的“Airbnb”


我们知道,能否及时获取足量计算资源可能会决定一家AI初创公司的成败。而通常只有规模最大、资金最充足、关系最广的大公司才能确保获得所需算力。高性能AI芯片不仅成本高昂,还需要签订长期合同,这对资金有限、业务需求多变的中小企业构成了巨大障碍。


SF Compute就是为了解决这个难题而生。它专注于为早期公司提供经济实惠、短期灵活的超级计算资源访问权限,帮助它们更高效、更经济地开发和训练AI模型。有点类似Airbnb在住宿领域的做法:通过共享和按需租赁,让用户以较低成本获取所需资源,短时间内使用大量计算能力。


具体是通过以下两种服务模式:


1. 短期计算资源租赁


与需要签订长期合同(通常为1~3年)的传统提供商不同,SF Compute提供按周、按天、甚至按小时计费的短期算力租赁服务。同时具备可扩展的集群,让用户根据实际需求来动态调整其计算资源使用量,完全实现“GPU定制自由”。


你可以租768个H100使用一周,也可以借8个H100运行2小时。SF Compute还为512~4096个GPU的大规模预订提供有竞争力的定价。例如租赁512个H100两周只需50万美元,远低于在其它提供商那里一年1200万美元的花费。


这种以实惠价格“爆发式”访问巨大算力的灵活选项,特别适合需要高性能计算但不想承担长期财务负担的用户。包括资金有限、业务可能快速变化的AI初创公司,以及实验室或研究员需要强大算力支持的短期项目等。


根据SF Compute官网信息(下图):当前GPU使用价格为2.85美元/小时,下一个可用时间段是8月4日。从现在到明年1月5日的可用容量在逐步增加,到年底达到912个H100 GPU。



目前三个公共算力集群部署中:Angel Island集群有192个H100 GPU,于去年11月上线。Bay Bridge和Coit Tower分别有512和1024个H100 GPU,计划明年春季上线。



2. 计算能力交易平台


除租赁服务外,SF Compute还在开发一个计算能力交易平台,以使用户更便捷地按需买卖计算资源,进一步降低算力获取难度和成本。通过允许小型AI公司与大企业竞争来民主化高性能计算的访问。


据悉,公司已经获得了相当于8000个H100的资源来支持这一计划。刚筹集的1200万元资金也会投入平台建设。


二、坐标旧金山脑谷,16人团队里三分之二当过创始人


SF Compute总部位于硅谷旧金山,办公室就设在AI公司扎堆密集、被称为“脑谷”的Hayes Valley。2023年由Alex Gajewski(右)和Evan Conrad(左)共同创立。


Alex Gajewski任公司CEO,毕业于哥伦比亚大学数学系。在开始旧金山计算公司之前,Alex曾创立Metaphor,主导训练了一个覆盖十亿页面的大型对比模型和一个神经搜索引擎。他还在公司加速器AI Grant第一批项目中发挥了重要作用。职业生涯致力于减少创建最先进AI模型的障碍和促进多样化的公司生态系统。


Evan Conrad在科技行业拥有丰富的职业生涯。曾在OpenAI的ChatGPT Enterprise部门短暂工作过,担任过八个月的AI Grant董事。之前联合创立了Quirk和Moder LLC并分别工作近四年。他还担任过Segment软件工程师,有Amazon和AppDetex的实习经历。


两人创立SF Compute的渊源也很有意思。


因成为合租室友而相识后,Alex和Evan本来是打算成立一家AI音乐初创公司。为了扩展音乐生成模型并向潜在投资者展示成果,他们联系了当时的每一家GPU提供商,以寻求1个月的算力访问权限。结果被所有人告知最少购买期限是一年,费用100万美元起步,而他们根本就拿不出100万。


“没人愿意只卖一个月的使用权。这很好理解:如果你运营一个大型集群,最好是以1到3年的合同出售并预先支付所有费用。这样风险更小,利润更高。为什么要把集群卖给Junelark这种几乎没有资金的两人音乐初创公司,况且他们可能在合同结束前就倒闭了?”Evan说,“不幸的是,我们就是Junelark。我们的朋友也大多数是这种情况。”


“如果你不是那些‘神圣的少数’之一,实际上就被市场定价排除在外。没有重大资金支持,你根本没得选择。”


寻求GPU受挫的两人于是尝试联系其他同样需要计算能力的创始人,认为如果有十几家初创公司一起加入,他们就能共同负担得起一份年度合同。


没想到短短几周内,就吸引来170家AI公司签约。看到这个庞大的市场需求后,两人果断放弃了AI音乐梦想,决定成为一个专门为大规模训练任务提供超级计算资源灵活访问的GPU云供应商。


不仅是“淋过雨后方知给他人撑伞”,在算力民主化、资源共享、扶持小型实体与大企业竞争这些备受硅谷科技社区推崇的理念背后,SF Compute也正中大量AI公司创始人苦于拿不到算力推进项目的痛点。


五个月前Evan Conrad在一次演讲中表示,SF Compute每个月都在把算力卖给学术实验室、研究人员、初创公司,这是其他人永远不会重视的客户。


当时他们的运营利润约为100万美元,预计在两个新集群上线后将增加10倍,达到每年1000万美元。公司的早期客户中还包括哈佛大学和普林斯顿大学的研究实验室,以及PlayHT Inc.、Phind和Liquid AI Inc.等初创公司。



目前SF Compute在LinkedIn的关联员工为16个人。Evan在X发文透露,其中有10名员工都是前创始人。他们也正在招聘核心基础设施工程师、机器学习系统工程师和产品工程师职位。


公司风格颇有《硅谷》电视剧里的感觉。员工们编程累了,就会解物理题目来“放松”。


也用文章开头那种朴实无华的方式打了许多本地硬广。


再看几个,比如路边公告牌:



候车大厅:




以及下面这条,“为你的下一个H100账单立省2000万美元。”


用户Micheal Black说,“唯有在旧金山有这样的sense。做广告的关键是了解你的客户。我在想,是的,我确实想在H100上省2000万!”



硅谷这片科技热土,历来盛产充满冒险精神的创业者和想创业的人们。通常现在一场前沿AI活动的观众里,一半以上都是人工智能相关公司创始人。


这些人对访问大量高性能AI计算资源有着迫切的渴求,却总被财大气粗的成熟企业挤到一边,可能手握出色的想法、技术却无法到现实世界验证和呈现。而今San Francisco Compute的出现,让双方得以互相成就。


三、市场竞争与未来发展


当然,SF Compute并不是唯一一家提供部分计算能力访问的公司,在市场中也面对几家颇为强大的同行对手。


例如Lambda Inc,最初是一家面部识别公司,后来转向为包括英特尔公司和国防部在内的顶尖机构提供按需的GPU工作站、服务器和云计算资源。更知名些的有“英伟达小弟”CoreWeave,起初是一家加密货币挖矿公司,也转型成GPU加速云计算服务供应商,专注于支持生成式AI和其他需要高性能计算的任务。最近它完成了11亿美元融资,估值已达190亿美元。另外还有提供低成本算力租赁服务的Vast.ai公司,和拥有全球分布GPU云及无服务器端点的RunPod公司等。


虽然竞争激烈,但SF Compute在短至小时的租赁时间和集群使用量上的灵活度、更具竞争力的价格和专注中小企业甚至个人等方面,还是拉拢了属于自己的特定客户群体。而未来即将推出的计算资源交易平台,也将成为它下一大制胜优势。


SF Compute称,接下来会把团队主要工程人员翻倍至30人,进一步增强服务能力,提高市场地位。


作为投资人,Jack Altman预计会有越来越多的用例出现:“风险投资公司和其他锁定长期GPU交易的公司都可以利用这个平台来买卖访问权。许多群体可能成为客户。”Jack Altman说,“San Francisco Compute已经展开了许多合作洽谈,我认为这是一个非常值得看好的方向。”


文章来源于“硅星人Pro”,作者“Jessica


AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI音乐

【开源免费】suno-api是一个使用监听技术实现了调用suno功能,并封装好API的AI音乐项目。

项目地址:https://github.com/gcui-art/suno-api

2
AI搜索

【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。

项目地址:https://github.com/InternLM/MindSearch

在线使用:https://mindsearch.openxlab.org.cn/


【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。

项目地址:https://github.com/miurla/morphic/tree/main

在线使用:https://www.morphic.sh/