AI资讯新闻榜单内容搜索-GPU

32B逆袭GPT-5.2：首个端到端GPU编程智能体框架StitchCUDA问世

现有的 LLM 自动化 CUDA 方法大多只能优化单个 Kernel，面对完整的端到端 GPU 程序（如整个 VisionTransformer 推理）往往束手无策。

来自主题: AI技术研报

9054 点击 2026-03-05 14:28

字节清华智能体自动写CUDA内核，比torch.compile加速2.11倍

让AI自己写高性能GPU代码，字节Seed与清华AIR团队做到了。

来自主题: AI技术研报

8387 点击 2026-03-04 10:39

英伟达放弃GPU上LPU：新推理芯片被曝Groq即买即用，OpenAI第一个吃螃蟹

据悉，在即将开幕的3月圣何塞GTC大会上，黄仁勋将发布一套全新的AI推理系统—— 核心是一颗专为推理优化的新芯片。而且芯片的首位大客户已经敲定，就是刚刚完成1100亿美元巨额融资的OpenAI。

来自主题: AI资讯

10329 点击 2026-03-02 14:48

创始团队出走一半，马斯克连夜调整xAI愿景，用百万GPU追平推理短板

当地时间 2 月 10 日和 11 日，xAI 的联合创始人 Tony Wu 和 Jimmy Ba 先后在社交平台 X 上宣布离职，这是继 Igor Babuschkin、Christian Szegedy 等人之后，xAI 创始团队在不到三年内的又一次核心人员变动。截至目前，xAI 最初 12 人的创始团队中已有六位成员离开。

来自主题: AI资讯

8517 点击 2026-02-12 10:41

RLinf-USER重磅发布！别再用仿真了，真实世界训练也能「极致效率与系统化」

首个统一系统：将物理机器人提升为与 GPU 同等的计算资源，打破硬件隔阂。

来自主题: AI技术研报

9820 点击 2026-02-11 14:00

不跟英伟达走老路，这家GPU公司的技术架构藏着哪些关键解？

对于国产 GPU 行业来说，没有哪个时间节点比当下更宝贵。在政策支持硬科技企业上市的背景下，国产 GPU 迎来了难得的上市黄金窗口期。但上市并非终点，在敲钟的那一刻，下一战场大幕已经拉开——GPU 厂商的技术路线、产品能力和长期判断，被放到了更公开也更严苛的舞台上，谁能撑起资本市场和大众期待，谁就能撑起市值。

来自主题: AI资讯

10365 点击 2026-01-29 15:22

Z Product｜解析Fal.ai爆炸式增长，为什么说“GPU穷人”正在赢得AI的未来？

10倍速度，重写单位经济：Fal.ai 通过自研推理引擎和极致的软件优化，实现比主流方案快一个数量级的推理速度。商业指标惊人。据Sacra估算，Fal在2025年7月达到约9500万美元年化收入run rate，较2024年7月约200万美元同比约4650% 。技术优势完全转化为市场无法忽视的经济优势。

来自主题: AI资讯

10818 点击 2026-01-28 12:06