AI资讯新闻榜单内容搜索-CUDA

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: CUDA

一份CUDA源码，跑上了苹果GPU

一份CUDA源码，跑上了苹果GPU

一份CUDA源码，跑上了苹果GPU

一段原本为英伟达 CUDA 设计的计算程序，几乎无需修改内核代码，就直接跑在了一台搭载 M3 Pro 的苹果设备上。

来自主题: AI资讯

5691 点击 2026-07-23 16:33

Fable 5手搓首个CUDA「超级内核」！2.5小时狂飙18.7倍

Fable 5手搓首个CUDA「超级内核」！2.5小时狂飙18.7倍

Fable 5手搓首个CUDA「超级内核」！2.5小时狂飙18.7倍

AI竟写出了，史上最快内核！在全新一轮GPU算子基准测试KernelBench-Mega中，Fable 5表现一骑绝尘。它在RTX PRO 6000，全程「纯手搓」CUDA，速度狂飙18.7倍。相比之下，强如Claude Opus 4.8也只跑出14.4倍，而GPT-5.5只有4.34倍。

来自主题: AI资讯

8765 点击 2026-07-09 09:35

GPT-5.6 Sol首批内测结果来了！同任务成本只有Fable 5一半

GPT-5.6 Sol首批内测结果来了！同任务成本只有Fable 5一半

GPT-5.6 Sol首批内测结果来了！同任务成本只有Fable 5一半

GPT-5.6 Sol预览版发布小半个月了，首批用户内测报告终于新鲜出炉！英伟达首席工程师用最直白最不绕弯子的话告诉你：Sol很猛！30小时，就跑赢了Opus 64小时才达到的CUDA加速效果。后续版本优化后，或将彻底碾压Opus……

来自主题: AI资讯

9581 点击 2026-07-07 09:56

还在手写CUDA内核？CODA来了！LLM和新手也能让Transformer跑出光速

还在手写CUDA内核？CODA来了！LLM和新手也能让Transformer跑出光速

还在手写CUDA内核？CODA来了！LLM和新手也能让Transformer跑出光速

5 月 22 日，Tri Dao 在社交媒体上转发了 Han Guo 的一条推文。他还写道：「经过一些数学重写，结果发现 Transformer 的所有内容都是一系列 GEMM + epilogue（矩阵乘法加尾声）。给定一些优化的原语，LLM（以及新手）就可以为所有 Transformer 操作编写光速内核！」

来自主题: AI技术研报

9141 点击 2026-05-25 10:13

老黄喝豆汁「破防」背后，国产GPU正在填上CUDA护城河

老黄喝豆汁「破防」背后，国产GPU正在填上CUDA护城河

老黄喝豆汁「破防」背后，国产GPU正在填上CUDA护城河

老黄在北京喝豆汁「翻车」，全网笑疯了。但真正值得警惕的，是他背后那个正在长出来的「中国版CUDA生态」。从万卡集群到机器狗，从SGLang主线到AI Agent自动迁移，这家公司这次不只是秀芯片，而是在重写国产GPU的游戏规则！

来自主题: AI资讯

10289 点击 2026-05-20 15:15

黄仁勋都被问毛了：顶级AI厂商在去CUDA？“你的前提就是错的”

黄仁勋都被问毛了：顶级AI厂商在去CUDA？“你的前提就是错的”

黄仁勋都被问毛了：顶级AI厂商在去CUDA？“你的前提就是错的”

很少看到黄仁勋这么激动。接近两个小时，正面回答关于英伟达一路在大模型时代涨到4万亿美元市值的种种问题。黄仁勋在“硅谷最受欢迎播客”的全新访谈，信息量有点高。视频发布半天，单在油管上的观看量已经超过10万+。

来自主题: AI资讯

7422 点击 2026-04-19 13:41

写Verilog、调CUDA，总翻车？工业代码大模型开始学会「先想后写」了

写Verilog、调CUDA，总翻车？工业代码大模型开始学会「先想后写」了

写Verilog、调CUDA，总翻车？工业代码大模型开始学会「先想后写」了

代码大模型会写代码，这件事已经不新鲜了。

来自主题: AI技术研报

10715 点击 2026-04-15 09:43

32B逆袭GPT-5.2：首个端到端GPU编程智能体框架StitchCUDA问世

32B逆袭GPT-5.2：首个端到端GPU编程智能体框架StitchCUDA问世

32B逆袭GPT-5.2：首个端到端GPU编程智能体框架StitchCUDA问世

现有的 LLM 自动化 CUDA 方法大多只能优化单个 Kernel，面对完整的端到端 GPU 程序（如整个 VisionTransformer 推理）往往束手无策。

来自主题: AI技术研报

8991 点击 2026-03-05 14:28

字节清华智能体自动写CUDA内核，比torch.compile加速2.11倍

字节清华智能体自动写CUDA内核，比torch.compile加速2.11倍

字节清华智能体自动写CUDA内核，比torch.compile加速2.11倍

让AI自己写高性能GPU代码，字节Seed与清华AIR团队做到了。

来自主题: AI技术研报

8344 点击 2026-03-04 10:39

别跟风买Mac Mini了！国产算力跑OpenClaw，只需5分钟

别跟风买Mac Mini了！国产算力跑OpenClaw，只需5分钟

别跟风买Mac Mini了！国产算力跑OpenClaw，只需5分钟

Clawdbot火爆全球，国产算力却不能用？AI Agent迎来高光时刻：Ollama只支持CUDA，中国团队直接把国产版开源了！正面硬刚Ollama，5分钟让国产芯片跑通OpenClaw！

来自主题: AI资讯

12228 点击 2026-02-03 16:14

上一页当前第1页,共6页下一页