AI资讯新闻榜单内容搜索-CUDA

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: CUDA
刚刚,英伟达CUDA迎来史上最大更新!

刚刚,英伟达CUDA迎来史上最大更新!

刚刚,英伟达CUDA迎来史上最大更新!

几个小时前,NVIDIA CUDA Toolkit 13.1 正式发布,英伟达官方表示:「这是 20 年来最大的一次更新。」CUDA Tile 是 NVIDIA CUDA Toolkit 13.1 最核心的更新。它是一种基于 tile 的编程模型,能够以更高的层次编写算法,并抽象化专用硬件(例如张量核心)的细节。

来自主题: AI资讯
8164 点击    2025-12-06 21:48
解读CUDA

解读CUDA

解读CUDA

“既然我可以直接使用 PyTorch,为什么还要费心使用 CUDA 呢?”

来自主题: AI技术研报
8805 点击    2025-12-03 09:51
谷歌训出Gemini 3的TPU,已成老黄心腹大患!Meta已倒戈

谷歌训出Gemini 3的TPU,已成老黄心腹大患!Meta已倒戈

谷歌训出Gemini 3的TPU,已成老黄心腹大患!Meta已倒戈

谷歌不再甘当「云房东」,启动激进的TPU@Premises计划,直接要把算力军火卖进Meta等巨头的自家后院,剑指英伟达10%的营收。旗舰TPU v7在算力与显存上彻底追平英伟达 B200,谷歌用「像素级」的参数对标证明:在尖端硬件上,黄仁勋不再寂寞。通过拥抱PyTorch拆解CUDA壁垒,谷歌正在用「私有化部署+同级性能」的组合拳,凿开万亿芯片帝国的坚固城墙。

来自主题: AI资讯
10278 点击    2025-11-26 09:44
零门槛deepfake!75.8k Star 的Deep-Live-Cam 一张照片秒换脸,开源 deepfake 神器本地跑!

零门槛deepfake!75.8k Star 的Deep-Live-Cam 一张照片秒换脸,开源 deepfake 神器本地跑!

零门槛deepfake!75.8k Star 的Deep-Live-Cam 一张照片秒换脸,开源 deepfake 神器本地跑!

Deep-Live-Cam 是一款开源的实时换脸与视频深度伪造(deepfake)工具,只需要一张人脸图片,就能在本地电脑上对摄像头画面或视频进行实时换脸。 支持 Windows / Linux / macOS,多种硬件加速(CPU / CUDA / CoreML / DirectML / OpenVINO),并内置不良内容检测与合规提示,定位是服务 AI 生成媒体行业的高效生产力工具。

来自主题: AI技术研报
7880 点击    2025-11-20 16:22
成本仅0.3美元,耗时26分钟!CudaForge:颠覆性低成本CUDA优化框架

成本仅0.3美元,耗时26分钟!CudaForge:颠覆性低成本CUDA优化框架

成本仅0.3美元,耗时26分钟!CudaForge:颠覆性低成本CUDA优化框架

CUDA 代码的性能对于当今的模型训练与推理至关重要,然而手动编写优化 CUDA Kernel 需要很高的知识门槛和时间成本。与此同时,近年来 LLM 在 Code 领域获得了诸多成功。

来自主题: AI技术研报
9374 点击    2025-11-18 10:06
CUDA再见了!寒武纪亮出软件全家桶

CUDA再见了!寒武纪亮出软件全家桶

CUDA再见了!寒武纪亮出软件全家桶

寒武纪成立的初衷是为「人工智能的大爆发」提供底层算力支持,不仅要硬件算力强大,更要软件通用、易用。寒武纪基础软件平台Cambricon NeuWare,让用户与开发者能够跨越不同的寒武纪硬件和应用场景,降低上手难度,提升开发效率,快速迁移与部署AI应用。

来自主题: AI资讯
7354 点击    2025-11-04 10:30
让你的Mac用上DeepSeek-OCR:一个从0到1的开源适配之旅

让你的Mac用上DeepSeek-OCR:一个从0到1的开源适配之旅

让你的Mac用上DeepSeek-OCR:一个从0到1的开源适配之旅

DeepSeek-OCR这段时间非常火,但官方开源的文件是“按 NVIDIA/CUDA 习惯写的 Linux 版推理脚本+模型权重”,而不是“跨设备跨后端”的通吃实现,因此无法直接在苹果设备上运行,对于Mac用户来说,在许多新模型诞生的第一时间,往往只能望“模”兴叹。

来自主题: AI技术研报
7757 点击    2025-10-29 17:10
CUDA内核之神、全球最强GPU程序员?OpenAI的这位幕后大神是谁

CUDA内核之神、全球最强GPU程序员?OpenAI的这位幕后大神是谁

CUDA内核之神、全球最强GPU程序员?OpenAI的这位幕后大神是谁

在 AI 圈里,聚光灯总是追逐着那些履历光鲜的明星人物。但一个伟大的团队,不仅有台前的明星,更有无数在幕后贡献关键力量的英雄。之前我们介绍了 OpenAI 的两位波兰工程师,最近 OpenAI 又一位身处幕后的工程师成为了焦点。

来自主题: AI资讯
8756 点击    2025-10-06 21:49
DeepSeek突然拥抱国产GPU语言!TileLang对标CUDA替代Triton,华为昇腾Day0官宣支持适配

DeepSeek突然拥抱国产GPU语言!TileLang对标CUDA替代Triton,华为昇腾Day0官宣支持适配

DeepSeek突然拥抱国产GPU语言!TileLang对标CUDA替代Triton,华为昇腾Day0官宣支持适配

DeepSeek v3.2有一个新改动,在论文里完全没提,只在官方公告中出现一次,却引起墙裂关注。开源TileLang版本算子,其受关注程度甚至超过新稀疏注意力机制DSA,从画线转发的数量就可以看出来。

来自主题: AI技术研报
8992 点击    2025-09-30 10:42
DeepSeek新模型上线!引入DSA新稀疏注意力,还又狙了CUDA一枪

DeepSeek新模型上线!引入DSA新稀疏注意力,还又狙了CUDA一枪

DeepSeek新模型上线!引入DSA新稀疏注意力,还又狙了CUDA一枪

刚发V3.1“最终版”,DeepSeek最新模型又来了!DeepSeek-V3.2-Exp刚刚官宣上线,不仅引入了新的注意力机制——DeepSeek Sparse Attention。还开源了更高效的TileLang版本GPU算子!

来自主题: AI资讯
10068 点击    2025-09-29 19:04