在算力投资激增的当下,GPU卡回收与维修行业逐渐成为一条隐秘的暴利赛道。
特别是一些众所周知的原因,串串资源的货源和魔改卡的维保是重灾区!
现状:运营一年以上的算力中心运营商手里一定有坏掉的A100和H100服务得不到及时维修,放在那吃灰,无法对外出租算力产生收入。
找原来设备供应商?!你能找到才怪,找到也不会及时给你维修,让你快递到xx或者国外,然后没有任何保障,这个时候要么相信他快递到国外xx,要么选择放在那吃灰,吃灰至少设备尸体还在,快递到xx也许连尸体也没有啦,来回快递费用巨贵不说,主要是不放心。
表面上,这一行业依赖专业技术解决用户的硬件问题,但实际上,其背后的利益链条远超想象。从低价回收到高价翻新,从维修陷阱到市场操控,技术外衣下的维修游戏正在上演!
所有人都能看到维修赛道的暴利!PCIE卡和SXM的维修江湖正进入资本视野。
很多人告诉我说他们运营了512甚至更多的H100服务器,我一般问他一个问题,就知道他是不是真的在运营还是在框我?
你们H100一共多少台?H100品牌是哪个?上线几年了?一年大概一共损坏了多少台?
只要能答上来的,就是真正的算力资产持有或者运营商,否则都是框我,领导不关注细节也许不知道,但是至少他的技术会知道,否则就是假的!
矿卡是永远无法回避的问题。回收商以低价格收购这些因长期高负荷运行而寿命受损的显卡或者1年运行周期的卡。
目前投资算力(4090和H100)最快的回收成本模式:一鱼三吃。
1.吃:4090和H100先挖一年矿。
2吃:卖给算力中心去换取绿电指标或者其他政府对价,验收后,机器搬走。
3吃:最后以9成新的4090和H100卖给二手商,二手商翻新成新卡供应市场。
上周某大厂H100 全包的算力租赁价格是4w/台/月,难道投资人真的傻么?!赔钱也做?!
很多人立项H100 每月收入6~8w/台/月,因为如果太少了5年回不来本,无法内部立项通过,一个赔钱的项目,内部怎么过会?!
SXM和PCIE卡是两个赛道,SXM某组上百万一组,核心不可维修,只能维修底板和外围组件。
典型操作:XID 63(ECC 错误)→ XID 64(重映射超限)→ XID 79(显存控制器保护),懂的都懂能看到,不懂的需要多学习学习啦。
越高端的卡,越不合规,越不合规,操作空间越大,成为灰色利益链成长的土壤。
目前高端卡比如H100 国内是没有正规官方维修中心的,因为这些卡原则上就不应该出现在大陆境内,这就给了大家想象空间。
SXM模组维修需要告纯净无尘空间,维修检测设备高达上千万,而且主要技术在弯弯和东南亚,这就给了大家更多想像空间。
GPU维修收费跟修车类似:
1.各种检测先来一套,只要到了维修商手里,各种检测先来一套,收费xx千;
2.检测数据出来诊断一套,把问题件list出来,能换的肯定不修,给来个报价,问你要修不?报价xx千;
3.决定修的时候,能用国产件,绝不用原装件,点亮即可,维修完,给你保障3个月,3个月之内,这个件坏了免费返修,但是国产件质量再差,他也不会三个月坏啊,其实他是6~12个月坏。零件费xx千;
4.更有甚至把原装核心元器件换走,用国产或者料板上的件代替。
一套操作下来xx万,怎么修车的就怎么修卡套路类似,懂的都懂。
维修商常以“核心损坏”为由迫使用户选择高价方案,并且给一个很高的价格,能换就不修。
例如:RX4090和H100矿卡回收价仅原价的5~7折或者更低,但经过简单翻新后,可伪装成“二手高品质卡”以数万元转卖,利润高达数倍。
例如:一张故障的H100模组,经过"换壳+刷数据"处理后,可伪装成全新卡以15万元价格转售,而实际维修成本不足5000元。这种操作在AI训练服务器领域尤为普遍。
例如:一个电源芯片损坏维修,夸大故障(如将电容损坏谎称为GPU问题),一个几十块钱的电源芯片,收取几千块,甚至更有只是虚汗,直接重新焊接一下,收取几万块!
文章来自微信公众号 “ 算力百科 ”,作者 算力百科 J