
TPU vs GPU: 2025年会有何不同?
TPU vs GPU: 2025年会有何不同?AI无处不在——从聊天机器人、推荐引擎到语音助手和ChatGPT或谷歌Gemini等工具。但在所有这些智能技术的背后,有一样东西经常被忽视:使这一切成为可能的硬件。
AI无处不在——从聊天机器人、推荐引擎到语音助手和ChatGPT或谷歌Gemini等工具。但在所有这些智能技术的背后,有一样东西经常被忽视:使这一切成为可能的硬件。
是的,秘塔AI搜索推出了全新“极速”模型。通过在GPU上进行kernel fusion,以及在CPU上进行动态编译优化,我们在单张H800 GPU上实现了最高400 tokens/秒的响应速度,大部分问题2秒内就能答完。
中国算力巨震,海光信息、中科曙光两大巨头官宣拟合并!
1000亿美元,砸出什么成果了?刚刚,一位记者深入阿比林基地,独家揭开了「星际之门」超算的神秘面纱。工人们007赶工,奥特曼、孙正义亲自坐镇,要在这片土地上重塑AI世界格局,这绝对是一场人类未来的豪赌。问题是,他们能赌赢吗?
英伟达,亲手打破了自己的天花板!刚刚,Blackwell单用户每秒突破了1000个token,在Llama 4 Maverick模型上,再次创下了AI推理的世界纪录。在官博中,团队放出了不少绝密武器。
该项目在今年1 月进一步扩大,Crusoe 与甲骨文签署了更大规模的租赁协议 ,新增 6 个数据中心,覆盖整个 1.2 吉瓦的场地,The Information 率先报道。该协议使甲骨文能为 OpenAI 提供的算力规模翻了两番,额外增加 30 万块 GPU。最初与 Blue Owl 成立的合资企业并不包含此次扩建计划。
随着大模型的参数规模不断扩大,分布式训练已成为人工智能发展的中心技术路径。
小心,5090要装定位了?美参议员12页法案,强制要求英伟达、AMD高端GPU和AI芯片植入「地理追踪」功能。法案若通过,6个月后生效。
E2B 的愿景很大,CEO 的目标是成为 AI Agent 时代的 AWS,成为一个自动化的 infra 平台,未来可以提供 GPU 支持,满足更复杂的数据分析、小模型训练、游戏生成等需求,并可以托管 agent 构建的应用,覆盖 agent 从开发到部署的完整生命周期。
刚刚,外媒爆料:2个月内,英伟达的中国特供版H20就要来了!不过,这次为了满足新的出口管制,H20在阉割版的基础上又继续做了阉割。H20订单已经爆了,总额达180亿!