ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
英伟达RTX 5090功耗高达600W,32G显存,核心比5080多一倍
5885点击    2024-09-27 20:51

RTX 50 系列的发布日期可能会在明年初。


英伟达的 RTX 50 系列会整出什么新活?


随着芯片发布日期的临近,人们的猜测也越来越密集起来。最近,海外知名爆料者 Kopite7kimi 放出了 GeForce RTX 5080 和 GeForce RTX 5090 显卡的初步规格信息,让我们对新 GPU 有了一些初步的概念。


如果消息正确,那么英伟达即将推出的 GeForce RTX 5090 将是一款拥有 600W 额定功率(TGP)的怪物。这些规格中的许多与之前的曝光内容一致,不过也有一些新的消息。



根据最新消息,用于台式电脑的旗舰 Blackwell 架构 GPU RTX 5090 预计将基于 GB202 图形处理器,配备 21760 个 CUDA 核心,使用 512 位接口与 32GB GDDR7 内存组合。如果消息准确,如此多的 FP32 核心将有大量功耗 —— 高达 600W(比 RTX 4090 高出 150W)。即使最终规格最终略逊一筹,这款显卡在发布时肯定会跻身 GPU 性能金字塔顶端。只是不要问价格……


相比之下,由 GB203 GPU 驱动的 RTX 5080 性能就要差上很多,据说它将配备 10752 个 CUDA 核心,大约是顶级产品的一半。RTX 5080 显卡预计将配备 16GB GDDR7 显存和 256 位接口,TGP 额定功率为 400W(RTX 4080 是 320W)。借助 GDDR7 带来的可观带宽提升,RTX 5080 在高分辨率下的表现应该会远超其前代产品,也会是一款强大的显卡。


Nvidia GeForce RTX 5000 系列显卡的初步规格:



虽然 GeForce RTX 5090 潜在的巨大性能确实引起了人们的关注,但另一件引人注目的事情是旗舰 RTX 5090 与 RTX 5080 之间的巨大性能差距。就流处理器和内存接口的数量而言,80 的规格几乎是 90 的一半。TGP 将是顶级卡的三分之二,因此 5080 时钟频率可能会更高以试图缩小与 5090 的差距,这代表着比 40 系列 GPU 型号之间更大的差异。


这种性能差异看起来很奇怪,可能表明英伟达希望尝试创造新的性能分层,或者限制某些消费卡作为人工智能计算替代品的吸引力。


纸面数据上,RTX 4090 比 RTX 4080 提供多 68% 的 GPU 核心、多 50% 的 VRAM、多 41% 的内存带宽以及多 13% 的 L2 缓存,CPU 的限制使 4090 性能无法倍杀,但在 4K 时 ultra 画面的任务上它最终会比第二级 40 系列 GPU 快了约 35%,而 RTX 3090 仅比 RTX 3080 快了约 15%。


而如果现在这些规格正确的话,RTX 5090 的性能可能高达 4080 的两倍。


虽然不能确定英伟达为什么决定以这种方式构建其下一代产品线,但可能的技术解释之一是英伟达的 GB202 处理器可能由两个 GB203 芯片组成。Blackwell GPU 使用多芯片设计的传闻已经有一段时间了,GB100/GB200 等数据中心 GPU 确实采用了这种架构。然而,使用 CoWoS-L 封装来实现消费级芯片之间的高速(~10 TB/s)互连似乎是一个非常昂贵的想法。


构建多芯片 GPU 的另一种方法是采用台积电 4 纳米级工艺技术构建具有超过 21760 个 CUDA 核心的单片图形处理器,这将产生约 650 mm^2 的芯片。


由于芯片尺寸较大,这种设计很难生产,这就是为什么通常会出现冗余的原因 —— 例如,4090 的 AD102 芯片最多有 144 个流多处理器 (SM),但仅启用了 128 个。因此,如果英伟达愿意的话,走这条路也不是不可能的。然而,单片芯片也非常昂贵,而且 RTX 5080 和 RTX 5090 之间存在如此巨大的差距会很奇怪。不过,其他 GPU 可以尝试填补这些漏洞,我们最终可能会看到后续型号可能有大约 18000 个可用的 CUDA 核心。


我们所能知道的是,英伟达在各种产品中使用相同的芯片:不论是台式机、笔记本还是专业和数据中心 GPU 都基于相同的硅片设计。


由于 AI 产业目前如此火热,英伟达很大程度上已将精力转为主攻数据中心产品,然后以其作为基础,面向消费者产品进行改款。如果是这样的话,如果 RTX 5090 最终定价比已经很贵的 4090 高出不少,你也不要感到惊讶 —— 我们甚至可能会看到 AI 专用变体在消费者型号之前问世。


目前,我们掌握的 Blackwell 架构 PC 显卡的所有信息都是非官方的。在英伟达直接发表任何言论之前,事情可能会发生变化。关于发布日期也存在相互矛盾的谣言,有人说 RTX 50 系列要到 2025 年初才会上市。如果这种说法正确的话,这将为在发布前继续调整配置提供充足的时间。


文章来自于“机器之心”,作者“泽南、小舟”。