手机实现GPT级智能,比MoE更极致的稀疏技术:省内存效果不减|对话面壁&清华肖朝军
手机实现GPT级智能,比MoE更极致的稀疏技术:省内存效果不减|对话面壁&清华肖朝军在大模型争霸的时代,算力与效率的平衡成为决定胜负的关键。
搜索
在大模型争霸的时代,算力与效率的平衡成为决定胜负的关键。
GPT-4.5比GPT-4聪明10倍!其背后的研发故事却鲜为人知。奥特曼携OpenAI团队首次敞开心扉,分享了幕后细节。从海量算力引发的「基础设施危机」,到「torch.sum bug」带来的意外突破,团队讲述了在挑战中实现智能飞跃。
不是你以为的AI PC,全球首个算力本——AIBOOK,它来了!
关税对算力产业链的影响正在产业链传导,H200终端涨价已成定局。之前英伟达设备是美禁止出口,并不是中国禁止进口,很多美国法律法规,中国根本不需要去遵守,所以H200 这些设备是正常报关,清关的。
杨杰表示,具体来看,AI的“规模效应”持续深化,呼唤基础设施新架构。作为数智化革命的重要驱动力量,AI发展呈现“两个规模效应”。在“两个规模效应”驱动下,AI任务成为算网基础设施承载的主要内容,到2030年在全网流量中的占比将达到64%。这一变化将对算网基础设施架构创新提出迫切需求。
全美AI行业的GPU供应链,都要被特朗普扼杀了?目前,GPU是否能被全面关税豁免,还是一个谜,整个硅谷都陷入了恐慌!大科技公司CEO们的身家,更是一夜缩水上百亿。
刚刚,Local AI 领域的 Libra 团队发布了一段最新技术演示视频,展示了用户通过自然语言交互直接生成 Agent,并利用本地消费级算力支持 Agent 进行长程 (Long-Horizon) 推理,最终完成复杂任务。
在算力投资激增的当下,GPU卡回收与维修行业逐渐成为一条隐秘的暴利赛道。特别是一些众所周知的原因,串串资源的货源和魔改卡的维保是重灾区! 现状:运营一年以上的算力中心运营商手里一定有坏掉的A100和H100服务得不到及时维修,放在那吃灰,无法对外出租算力产生收入。
贾扬清创业公司LeptonAI,要卖给英伟达了?
「70 年的 AI 研究历史告诉我们一个最重要的道理:依靠纯粹算力的通用方法,最终总能以压倒性优势胜出。」如今,似乎可以重新再聊下这个话题。比如前两天我们发的 Agent 文章里的观点:未来 AI 智能体的发展方向还得是模型本身,而不是工作流(Work Flow)。