老黄重磅发布5090,定价15000!22000元的世界最小AI超级计算机也来了

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
老黄重磅发布5090,定价15000!22000元的世界最小AI超级计算机也来了
5789点击    2025-01-07 15:16

就在刚刚,老黄穿着全新的皮衣,在CES上一波接一波放大招。


先是发布了自家最新的GPU——RTX 5090


老黄重磅发布5090,定价15000!22000元的世界最小AI超级计算机也来了


直接来看下基于Blackwell架构的最新GPU主要性能:


  • 拥有920亿个晶体管
  • 具备4000 AI TOPS(每秒万亿次操作)的性能
  • 能够实现380 RT TFLOPS(每秒万亿次浮点运算)的光线追踪性能
  • 具备1.8 TB/s 的内存带宽,能够快速地读取和写入数据
  • 具有125 Shader TFLOPS 的着色器性能


老黄重磅发布5090,定价15000!22000元的世界最小AI超级计算机也来了


这一50系列GPU的价格也直接一道公布:


  • RTX 5090:1999美元(约14651元)
  • RTX 5080:999美元(约7321元)
  • RTX 5070 Ti:749美元(约5489元)
  • RTX 5070:549美元(约4023元)


老黄重磅发布5090,定价15000!22000元的世界最小AI超级计算机也来了


而Blackwell架构关键的互联技术也上了波新的——NVLink72


依旧是快速来看下主要性能亮点:


  • 72个Blackwell GPU具备1.4 ExaFLOPS TE FP4计算能力
  • 晶体管数量达到130万亿
  • 拥有2592个 Grace CPU核心
  • 72个ConnectX - 8网络接口卡
  • 576个存储芯片,总容量14TB,带宽1.2PB/s
  • 18个NVLink交换机,全连接带宽130 TB/s

老黄重磅发布5090,定价15000!22000元的世界最小AI超级计算机也来了



非常有意思的是,老黄现场还手持巨大的样品,宛如一个盾牌,开始了整活儿:


老黄重磅发布5090,定价15000!22000元的世界最小AI超级计算机也来了


除此之外,AI超算,现在迎来了PC时刻。


因为就在刚刚,老黄一道还发布全球最小的个人AI超级计算机——Project Digits


老黄重磅发布5090,定价15000!22000元的世界最小AI超级计算机也来了


有多强悍?


2000亿参数的大模型,直接在你办公桌上(自己的桌面系统)就能跑!


老黄重磅发布5090,定价15000!22000元的世界最小AI超级计算机也来了


如果把两台Project Digits一块“食用”,那么还可以跑4050亿参数的大模型。


老黄重磅发布5090,定价15000!22000元的世界最小AI超级计算机也来了


据了解,每个Project DIGITS配备了128GB统一、相干内存和高达4TB的NVMe存储,仅需标准电源插座即可运行。


并且在桌面系统上对大模型搞完开发或推理之后,还可以无缝部署到加速云或数据中心基础设施里。


正如老黄在现场所说的那样:


AI将成为每个行业、每个应用的主流。


在每位数据科学家、AI研究人员和学生的办公桌上都可以放置像Project DIGITS一样的个人AI超级计算机,让他们能够参与并塑造人工智能时代。


而且Project DIGITS不用等太久哦,今年5月份就会开始提供,起售价3000美元(约21978元)。


那么Project DIGITS又是如何做到又小又彪悍的呢?


搭载了全新的GB10超级芯片


Project DIGITS的关键,就在于它搭载的全新Grace Blackwell超级芯片(GB10)


这个系列芯片想必大家并不陌生了,基于Grace Blackwell架构,是一款片上系统(SoC)。


在FP4精度下可以提供高达1千万亿次浮点运算的AI性能。


老黄重磅发布5090,定价15000!22000元的世界最小AI超级计算机也来了


GB10包含了英伟达Blackwell GPU(具有最新一代 CUDA 核心和第五代 Tensor Cores),通过 NVLink-C2C 芯片到芯片互连连接到高性能 NVIDIA Grace CPU(采用 Arm 架构的 20 个节能核心)。


据了解,联发科参与了GB10的设计,对提升能效、性能和连接性等方面起到了一定作用。


老黄重磅发布5090,定价15000!22000元的世界最小AI超级计算机也来了



基于这样的架构,企业和研究人员可以在本地运行Linux系统的Project DIGITS上进行模型原型设计、微调与测试,再部署到NVIDIA DGX Cloud等上面。


用户还可以访问因为大的AI软件库,包括NGC目录和开发者门户中的软件开发工具包、编排工具、框架和模型等,可用NVIDIA NeMo框架微调模型、NVIDIA RAPIDS库加速数据科学,运行PyTorch等常见框架。


还可利用NVIDIA Blueprints和NVIDIA NIM微服务构建智能AI应用;据了解,从实验到生产环境时,NVIDIA AI Enterprise许可证提供企业级安全等支持。


允许商用的世界基础模型Cosmos


与此同时,老黄还宣布英伟达将开源允许商用的世界基础模型——Cosmos


老黄重磅发布5090,定价15000!22000元的世界最小AI超级计算机也来了


Cosmos平台既包括用于生成物理世界合成数据的扩散及自回归Transfomer模型,还有视频Tokenizer以及用来加速视频处理的管道。


其中,Cosmos基础模型在2000万小时的驾驶和机器人视频数据上训练而成,主要用来加速自动驾驶和下一代机器人训练研发。


开发者既可以用Cosmos生成物理合成数据,也可以用英伟达NeMo框架+私有视频数据进行微调。


而如此发布也是基于目前AI技术的发展大势。


老黄重磅发布5090,定价15000!22000元的世界最小AI超级计算机也来了


具体而言,本次CES大会上,老黄一共介绍了三类模型:


  • Nano:超低延迟的实时模型,优化用于边缘部署;
  • Super:高性能基线模型,适用于开箱即用的微调和部署;
  • Ultra:最高准确度和质量,适合模型定制;


老黄重磅发布5090,定价15000!22000元的世界最小AI超级计算机也来了


据介绍,这些模型的参数大约为40亿~140亿,任何企业无论规模大小,都可以自由使用Cosmos模型。


目前已公布的第一批试用者包括机器人公司1X、Agility Robotics,以及自动驾驶领域的Uber、小鹏、比亚迪等。


老黄重磅发布5090,定价15000!22000元的世界最小AI超级计算机也来了


对了,老黄这次特意官宣丰田将基于英伟达芯片和操作系统开发下一代新能源汽车。


老黄重磅发布5090,定价15000!22000元的世界最小AI超级计算机也来了


从用法展示来看,Cosmos已经能够帮助工业界和自动驾驶生成大量数据,从而加速相关AI技术研发了。


老黄重磅发布5090,定价15000!22000元的世界最小AI超级计算机也来了


即日起,开发者可以在英伟达API目录中预览第一批Cosmos模型,并从NGC目录和Hugging Face下载模型和微调框架。


另外,Cosmos也为进一步扩展Omniverse(英伟达工业数字化和物理AI仿真平台)提供了新的可能。


开发者可在Omniverse中构建3D场景,渲染输出后用于Cosmos模型生成合成虚拟环境,最终用于物理人工智能训练。


老黄重磅发布5090,定价15000!22000元的世界最小AI超级计算机也来了


老黄重磅发布5090,定价15000!22000元的世界最小AI超级计算机也来了


还有比较壮观的场面,就是老黄站在一排机器人的中间,颇有具身智能boom时代的意味。


老黄重磅发布5090,定价15000!22000元的世界最小AI超级计算机也来了


还有两个新模型服务


除了非常fashion的世界模型之外,老黄这次还发布了两个大方向的模型服务。


一个是AI基础模型,主要适用于RTX AI PC,主打的就是轻松、灵活开发。


具体而言,通过连接到图形用户界面(GUI)的NIM微服务,用户可轻松访问和部署最新生成式 AI 模型。


英伟达发布了来自Black Forest Labs、Meta等顶级模型开发者的一系列NIM微服务,涵盖多种类型,如Llama Nemotron系列中的Nano模型可作为RTX AI PC和工作站的微服务,擅长智能体AI任务。


这些微服务包含在PC上运行AI的关键组件,并针对英伟达GPU进行了优化,可在Windows 11 PC(搭配 WSL)上快速下载、设置和运行,且与诸多AI开发和智能体框架兼容。


老黄重磅发布5090,定价15000!22000元的世界最小AI超级计算机也来了


NIM微服务之外,AI蓝图(AI Blueprints)也即将在PC上可用。


AI蓝图是基于NIM微服务构建而来,主要为数字人类、内容创作等提供预配置参考工作流程。


例如PDF转播客蓝图可提取PDF内容生成脚本及音频,3D引导生成式AI蓝图能让艺术家利用3D场景更好地控制图像生成。


具体到产品,英伟达预览了Project R2X,这是一个具有视觉功能的PC虚拟形象,可通过NVIDIA RTX Neural Faces算法渲染面部,并由新的Audio2Face - 3D模型驱动动画,能连接多种AI服务和微服务。


据了解,从今年2月开始,NIM微服务和AI蓝图就可以使用了,多家PC制造商和系统构建商将推出支持NIM的RTX AI PC。


同样是基于NIM微服务,英伟达这次还推出了Nemotron模型家族,包括:


  • Llama Nemotron大型语言模型
  • Cosmos Nemotron视觉语言模型


这两个大模型则是更倾向于AI智能体方向。


Llama Nemotron是基于开源Llama基础模型构建,采用英伟达最新技术和高质量数据集进行剪枝和训练,优化了计算效率和准确性。


擅长指令遵循、聊天、函数调用、编码和数学等,尺寸经过优化可在多种英伟达加速计算资源上运行。


尺寸方面同样包含Nano、Super 和 Ultra三种大小:


  • Nano成本效益高,适用于低延迟实时应用和PC及边缘设备;
  • Super在单个GPU上提供高吞吐量和高精度;
  • Ultra为数据中心规模应用设计,精度最高。


老黄重磅发布5090,定价15000!22000元的世界最小AI超级计算机也来了


Cosmos Nemotron视觉语言模型则是结合了英伟达的NIM微服务,可以让开发者构建能分析和响应图像及视频的智能体,应用于多个领域。


One More Thing


就在老黄登上CES之前,英伟达股价又又又创下了历史新高!


涨幅超3%,收盘价为149.43美元(高于去年11月7日创下的每股148.88美元收盘纪录),最新估值达到3.66万亿美元,成为仅次于苹果的全球第二大上市企业。


老黄重磅发布5090,定价15000!22000元的世界最小AI超级计算机也来了

图源𝕏 @YahooFinance


不知道这次发布的东西是否符合大家的期待捏?


老黄重磅发布5090,定价15000!22000元的世界最小AI超级计算机也来了


参考链接:

[1]https://www.youtube.com/live/k82RwXqZHY8

[2]https://x.com/YahooFinance/status/1876376522766024882


文章来微信公众号“量子位”,作者“金磊 一水”


老黄重磅发布5090,定价15000!22000元的世界最小AI超级计算机也来了

关键词: AI , RTX 5090 , GPU , AI芯片
AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI工作流

【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费)


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/(付费)

2
数字人

【开源免费】Fay开源数字人框架是一个AI数字人项目,该项目可以帮你实现“线上线下的数字人销售员”,

“一个人机交互的数字人助理”或者是一个一个可以自主决策、主动联系管理员的智能体数字人。

项目地址:https://github.com/xszyou/Fay

3
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

4
微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。

项目地址:https://github.com/InternLM/xtuner

5
无人直播

【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。

项目地址:https://github.com/Henry-23/VideoChat

在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat


【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。

项目地址:https://github.com/PeterH0323/Streamer-Sales