
英伟达再破世界纪录,每秒1000 token!刚刚,全球最快Llama 4诞生
英伟达再破世界纪录,每秒1000 token!刚刚,全球最快Llama 4诞生英伟达,亲手打破了自己的天花板!刚刚,Blackwell单用户每秒突破了1000个token,在Llama 4 Maverick模型上,再次创下了AI推理的世界纪录。在官博中,团队放出了不少绝密武器。
英伟达,亲手打破了自己的天花板!刚刚,Blackwell单用户每秒突破了1000个token,在Llama 4 Maverick模型上,再次创下了AI推理的世界纪录。在官博中,团队放出了不少绝密武器。
在刚刚结束的GTC大会上,黄仁勋公布了英伟达面向未来AI工厂的GPU路线图,从Ampere、Hopper,到Blackwell、Rubin和Feynman,每一代GPU架构都以历史上杰出的科学家命名。这些名字背后,不仅凝聚了人类科学智慧的巅峰成就,也寄托着Nvidia对科技创新的致敬与传承。
老黄在GTC 2025大会上,再次亮出了英伟达未来GPU路线图。随着推理token的暴增,AI计算需要全新的范式,下一代BlackWell Ultra、Vera Rubin就是最强的回应。
Blackwell刚开始大规模发货,科技界已经将目光投向了下一代「Rubin」。英伟达的GTC开发者大会,从昔日9000人到如今被戏称为「AI Woodstock」的25000人狂欢,英伟达早已建立起自己的AI帝国!本周黄仁勋将带来哪些惊喜?Rubin会否再掀性能革命?
最近,英伟达开源了首个在Blackwell架构上优化的DeepSeek-R1,实现了推理速度提升25倍,和每token成本降低20倍的惊人成果。同时,DeepSeek连续开源多个英伟达GPU优化项目,共同探索模型性能极限。
华尔街屏息凝神,硅谷一夜无眠。
本周三,各路媒体对英伟达 GeForce RTX 5090 的评测宣告解禁。基于最新 Blackwell 架构,新一代旗舰显卡无疑将成为未来几年你能买到的最好的显卡。
2025年1月7日上午,在CES大会开幕式上,身穿黑皮衣的英伟达创始人黄仁勋,用一番激情演讲,拉开了新一年AI的大幕——英伟达不仅推出了新一代基于Blackwell架构的GPU RTX 5090,还发布了开源可商用的世界基础模型Cosmos。两项产品,为AI应用的变革提供了全新的“基础设施”。
2025 CES上最具话题性的两家公司,都谈到了AI PC的核心话题。 在通过新一代Blackwell 架构的英伟达 RTX 5090 显卡炸场后,黄仁勋彻底点燃了CES开场情绪。但其后,他依然不得不在会后交流中回应关于AI PC“销量没能起飞”的尖锐话题。
根据 The Information 报道,字节跳动计划 2025 年斥资 70 亿美元投入英伟达最新的 Blackwell 芯片,该计划由张一鸣主导。