英伟达的个人超算,可能就是下一个消费级显卡|CES 2026

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
英伟达的个人超算,可能就是下一个消费级显卡|CES 2026
8665点击    2026-01-08 09:27

今年的 CES 黄仁勋主题演讲上,罕见的,他没有介绍英伟达的消费级显卡。


目前最新的消费级 GPU,还是去年在 CES 上正式发布的 RTX 50 系列。其中必然有内存全球大涨价的原因,当前市场的内存成本,一周之内就能涨价 50%-100%,并且多个分析机构表示,涨价会持续到 2027 年。


更多的原因还是 AI,就拿 AI 训练和部署来说。一块 RTX 5090 显卡的最大显存是 32GB,随便找一个表现不错的开源大模型,参数都是以百亿为单位,所需要的显存容量,32G 的优势会比较有限。


英伟达的个人超算,可能就是下一个消费级显卡|CES 2026


但英伟达显然不会放弃本地计算的市场,今年不发消费级的显卡,有了全新的消费级个人超算。


英伟达在 CES 2026 上展示了全新的 DGX Spark,并且用它完成了多个 AI 相关的任务。开发者和创作者不需要昂贵的数据中心,通过 DGX Spark,就可以在本地流畅运行、微调,甚至推理高达 100B 参数的前沿 AI 模型。


我们之前也分享过 DGX Spark 的上手体验,下载 1200 亿参数的 GPT-OSS 开源模型,或者部署 Qwen 图片生成、Wan 2.2 视频生成,DGX Spark 都能做到。


再回顾一下 DGX Spark 的主要情况。


英伟达的个人超算,可能就是下一个消费级显卡|CES 2026


  • 核心架构:基于 NVIDIA Grace Blackwell 架构打造,将数据中心级别的 AI 算力,浓缩到了紧凑的桌面机箱中。


  • 海量内存:单机配备 128GB 统一内存。更为独特的是,它支持通过 200Gbps 的 ConnectX-7 网络,将两台 DGX Spark 互连,组成拥有 256GB 内存的超级节点。


  • 核心能力:专为大模型时代设计,支持在本地运行 100B 参数级别的模型,或者对 70B 参数的 LLM 进行分布式微调。


  • 定位:它不仅是开发者的沙盒环境,而且还要做 AI 创作者的平台,主要是让高强度的 AI 工作负载,脱离云端依赖,在本地安全、低延迟地完成。


本次 CES 更新的最大亮点,在于通过软件升级引入了对 NVFP4 数据格式的全面支持。NVFP4 的数据格式,能够让新一代模型在保持智能表现的同时,内存占用降低约 40%,吞吐量大幅提升。


具体的实测数据,在两个 DGX Spark 配置上运行 Qwen-235B 模型时,使用 NVFP4 相比 FP8 性能提升最高可达 2.6 倍。这直接地解决了,过去使用 FP8 精度时双系统内存耗尽、无法多任务处理的难题。


硬件在桌面上,但访问方式可以很云端。CES 上展示的 Brev 更新,还解决了 DGX Spark 本地算力灵活性不足的问题。


英伟达的个人超算,可能就是下一个消费级显卡|CES 2026


现在,开发者可以通过 Brev,安全地远程连接 DGX Spark,就像使用云服务一样便捷。此外,Brev 支持智能路由层。用户可以将处理邮件或专有数据等敏感任务,强制保留在本地 DGX Spark 上运行,而将一般推理任务无缝路由至云端,兼顾了隐私安全与云端算力。


Brev 的引入,解决了本地算力不仅能用,还要好用的问题。它的本地计算支持预计于 2026 年春季正式推出。


这么强的算力能用来做什么,英伟达在 CES 现场的演示也给出了答案。


对于视频创作者,这是强大的创意生成加速器。将 AI 视频生成任务从笔记本转移到 DGX Spark 上,相比顶配 M4 Max 的 MacBook Pro,速度实现了高达 8 倍的提升,真正做到了让创作流不再卡顿。


不仅是个人开发者,对于注重本地安全的企业用户,DGX Spark 也能胜任。英伟达展示了由 Nsight 驱动的本地 CUDA 编码助手,企业开发者可以在享受 AI 辅助的同时,确保源代码完全存储在本地,杜绝信息泄露风险。


更有意思的演示是和机器人的结合。通过与 Hugging Face 的合作,DGX Spark 化身 Reachy Mini 机器人的「大脑」,让机器人具备了实时视听交互能力。现在看起来,用 DGX Spark 来做具身智能,也不再是大厂的专属。


英伟达的个人超算,可能就是下一个消费级显卡|CES 2026


Hugging Face 产品副总裁 Jeff Boudier 也提到,「开放模型赋予开发者以自己的方式构建 AI ,而 DGX Spark 将这种能力带到桌面端……让强大的 AI 变成真正可以互动的存在。」


英伟达的个人超算,可能就是下一个消费级显卡|CES 2026


为了降低开发者的门槛,英伟达还在 CES 上一口气新增了 6 个 Playbook(实战手册),重点覆盖了当下的热门需求。


Nemotron 3 Nano,英伟达最新的开源智能体大模型,用于本地 LLM 实验。


Live VLM WebUI,实时视觉语言模型分析,通过输入网络摄像头画面,直接在 DGX Spark 本地进行视频分析。


Isaac Sim / Lab,机器人仿真与强化学习。


双系统微调,展示了如何利用两台 DGX Spark,分布式微调 70B 参数的 LLM。


英伟达的个人超算,可能就是下一个消费级显卡|CES 2026


除了 Playbook 的更新,DGX Spark 还预装了经过优化的 NVIDIA AI 软件和 CUDA-X 库。这意味着开发者无需在繁琐的驱动配置,和环境依赖上浪费时间,开箱即可获得「即插即用」的优化能力,直接开始构建或微调 AI 模型。


DGX Spark 在 CES 2026 上的出现,意味着「大模型本地化」已经不再是一句空话。无论是为了数据安全、开发效率,还是为了探索具身智能,DGX Spark 都在努力成为下一代 AI 应用构建的基座。


就像现在,已经开始有让 AI 来玩游戏的项目了,未来需要的,可能除了一块能流畅打《黑神话:悟空》的 5090,还会有更多的桌面级 AI 超级计算机出现。


文章来自于“APPSO”,作者 “APPSO”。

关键词: AI新闻 , AI超算 , RTX 50 , AI硬件
AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。

项目地址:https://github.com/browser-use/browser-use


2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

3
微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。

项目地址:https://github.com/InternLM/xtuner