AI资讯新闻榜单内容搜索-CUDA

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: CUDA
华为版CUDA,全面开源了

华为版CUDA,全面开源了

华为版CUDA,全面开源了

华为版本CUDA,全面开源开放! 最新消息,华为宣布为其昇腾AI GPU开源其CANN软件工具包。

来自主题: AI资讯
5386 点击    2025-08-07 11:36
无需CUDA代码给H100加速33%-50%,Flash Attention作者新作火了

无需CUDA代码给H100加速33%-50%,Flash Attention作者新作火了

无需CUDA代码给H100加速33%-50%,Flash Attention作者新作火了

无需CUDA代码,给H100加速33%-50%! Flash Attention、Mamba作者之一Tri Dao的新作火了。

来自主题: AI技术研报
8187 点击    2025-07-11 16:06
斯坦福华人天团意外爆冷!AI用纯CUDA-C编内核,竟干翻PyTorch?

斯坦福华人天团意外爆冷!AI用纯CUDA-C编内核,竟干翻PyTorch?

斯坦福华人天团意外爆冷!AI用纯CUDA-C编内核,竟干翻PyTorch?

本想练练手合成点数据,没想到却一不小心干翻了PyTorch专家内核!斯坦福华人团队用纯CUDA-C写出的AI生成内核,瞬间惊艳圈内并登上Hacker News热榜。团队甚至表示:本来不想发这个结果的。

来自主题: AI技术研报
7121 点击    2025-05-31 17:30
搞不懂CUDA的人有救了,Devin开发商开源Kevin,强化学习生成CUDA内核

搞不懂CUDA的人有救了,Devin开发商开源Kevin,强化学习生成CUDA内核

搞不懂CUDA的人有救了,Devin开发商开源Kevin,强化学习生成CUDA内核

本周三,知名 AI 创业公司,曾发布「全球首个 AI 软件工程师」的 Cognition AI 开源了一款使用强化学习,用于编写 CUDA 内核的大模型 Kevin-32B。

来自主题: AI技术研报
9163 点击    2025-05-07 15:23
DeepSeek-R1自写CUDA内核跑分屠榜!斯坦福学霸狂飙GPU编程自动化挑战人类

DeepSeek-R1自写CUDA内核跑分屠榜!斯坦福学霸狂飙GPU编程自动化挑战人类

DeepSeek-R1自写CUDA内核跑分屠榜!斯坦福学霸狂飙GPU编程自动化挑战人类

斯坦福和普林斯顿研究者发现,DeepSeek-R1生成的自定义CUDA内核,完爆了o1和Claude 3.5 Sonnet,拿下总排名第一。虽然目前只能在不到20%任务上超越PyTorch Eager基线,但GPU编程加速自动化的按钮,已经被按下!

来自主题: AI技术研报
9728 点击    2025-02-27 16:17