
英伟达新GPU,超长上下文/视频生成专用
英伟达新GPU,超长上下文/视频生成专用老黄对token密集型任务下手了。
老黄对token密集型任务下手了。
虽然大家都期待未来的 Agent 能够真正端到端完成所有任务,并且在出错时也知道如何重新开始,但目前 AI 还没有达到这种能力。
今年是人工智能正式被提出七十周年,新智元十周年峰会也将于9月7日在北京中关村软件园举行,主题是「新天终启,万象智生」。此次峰会将发布《2025新智元ASI前沿趋势报告》,大会集结百度CTO、NVIDIA副总裁等十位领航者,以「十人十题」解构AI五阶段路线图,纵贯大模型、Physical AI、具身智能到医疗AI、视频AI、脑科学、AI Agent与人才培养,定义下个十年智能图景。
英伟达发布全新架构9B模型,以Mamba-Transformer混合架构实现推理吞吐量最高提升6倍,对标Qwen3-8B并在数学、代码、推理与长上下文任务中表现持平或更优。
NVIDIA和AMD,终于有对手了? 一家名不见经传的芯片初创公司——Bolt Graphics,在最新发布的测试中抛出惊人数据: 其首款GPU模组Zeus 4C,在路径追踪(Path Tracing)场景中,性能飙至RTX 5090的13倍。
在瞬息万变的算力租赁市场中,NVIDIA 5090 8 卡机的租赁价格在短短两个月内经历了令人瞩目的下跌,从最初的 12000 元以上跌至如今的 8000 元以下(12 月闭口)。
Fireworks AI 作为新兴云服务商的一员,向开发者出租搭载 NVIDIA 芯片的服务器以运行人工智能模型。据两位知情人士透露,该公司正以 40 亿美元估值进行融资谈判,这一数字较一年前估值增长逾七倍。
GMI Cloud亮相WAIC 2025,展示AI云服务及NVIDIA合作技术成果
众所周知,老黄不仅卖铲子(GPU),还自己下场开矿(造模型)。
据The Information报道,微软正在重绘其自研人工智能服务器芯片的产品路线图,将在未来几年内专注于推出设计更保守、开发难度更低的芯片版本,目标是在2028年前克服当前导致研发延迟的一系列问题。