AI资讯新闻榜单内容搜索-GPU

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: GPU
妈妈再也不用担心延迟了!斯坦福手搓Llama超级内核,推理仅需0.00068秒

妈妈再也不用担心延迟了!斯坦福手搓Llama超级内核,推理仅需0.00068秒

妈妈再也不用担心延迟了!斯坦福手搓Llama超级内核,推理仅需0.00068秒

斯坦福Hazy实验室推出新一代低延迟推理引擎「Megakernel」,将Llama-1B模型前向传播完整融合进单一GPU内核,实现推理时间低于1毫秒。在B200上每次推理仅需680微秒,比vLLM快3.5倍。

来自主题: AI技术研报
7923 点击    2025-05-30 12:36
100亿H20没卖出,英伟达狂赚1000多亿破纪录!

100亿H20没卖出,英伟达狂赚1000多亿破纪录!

100亿H20没卖出,英伟达狂赚1000多亿破纪录!

英伟达赚麻了!AI推理全面爆发,芯片巨头2026财年Q1营收达441亿美元,净利润飙升至188亿美元,双双远超市场预期!

来自主题: AI资讯
8987 点击    2025-05-29 18:22
还得是华为!Pangu Ultra MoE架构:不用GPU,你也可以这样训练准万亿MoE大模型

还得是华为!Pangu Ultra MoE架构:不用GPU,你也可以这样训练准万亿MoE大模型

还得是华为!Pangu Ultra MoE架构:不用GPU,你也可以这样训练准万亿MoE大模型

Pangu Ultra MoE 是一个全流程在昇腾 NPU 上训练的准万亿 MoE 模型,此前发布了英文技术报告[1]。最近华为盘古团队发布了 Pangu Ultra MoE 模型架构与训练方法的中文技术报告,进一步披露了这个模型的细节。

来自主题: AI技术研报
7885 点击    2025-05-29 16:47
清华创业团队打造!国内首个专注AI推理Serverless GPU平台

清华创业团队打造!国内首个专注AI推理Serverless GPU平台

清华创业团队打造!国内首个专注AI推理Serverless GPU平台

你有没有遇到过这样的算力困境:买了 GPU,用不了几次就闲置烧钱,偶尔想用的时候却一卡难求?

来自主题: AI技术研报
4801 点击    2025-05-28 15:09
Meta「轻量级」KernelLLM颠覆GPU内核生成,8B参数碾压GPT-4o

Meta「轻量级」KernelLLM颠覆GPU内核生成,8B参数碾压GPT-4o

Meta「轻量级」KernelLLM颠覆GPU内核生成,8B参数碾压GPT-4o

Meta推出KernelLLM,这个基于Llama 3.1微调的8B模型,竟能将PyTorch代码自动转换为高效Triton GPU内核。实测数据显示,它的单次推理性能超越GPT-4o和DeepSeek V3,多次生成时得分飙升。

来自主题: AI技术研报
5885 点击    2025-05-27 18:00
TPU vs GPU: 2025年会有何不同?

TPU vs GPU: 2025年会有何不同?

TPU vs GPU: 2025年会有何不同?

AI无处不在——从聊天机器人、推荐引擎到语音助手和ChatGPT或谷歌Gemini等工具。但在所有这些智能技术的背后,有一样东西经常被忽视:使这一切成为可能的硬件。

来自主题: AI技术研报
6989 点击    2025-05-27 11:21
秘塔AI推出“极速”模型,400 tokens/s,你搜索,我秒回

秘塔AI推出“极速”模型,400 tokens/s,你搜索,我秒回

秘塔AI推出“极速”模型,400 tokens/s,你搜索,我秒回

是的,秘塔AI搜索推出了全新“极速”模型。通过在GPU上进行kernel fusion,以及在CPU上进行动态编译优化,我们在单张H800 GPU上实现了最高400 tokens/秒的响应速度,大部分问题2秒内就能答完。

来自主题: AI资讯
9097 点击    2025-05-27 09:45
4000亿国产算力航母:芯片巨头合并超算巨头

4000亿国产算力航母:芯片巨头合并超算巨头

4000亿国产算力航母:芯片巨头合并超算巨头

中国算力巨震,海光信息、中科曙光两大巨头官宣拟合并!

来自主题: AI资讯
5907 点击    2025-05-26 15:07
星际之门内部惊人曝光:40万块GPU爆铺!奥特曼千亿豪赌险把电网干崩

星际之门内部惊人曝光:40万块GPU爆铺!奥特曼千亿豪赌险把电网干崩

星际之门内部惊人曝光:40万块GPU爆铺!奥特曼千亿豪赌险把电网干崩

1000亿美元,砸出什么成果了?刚刚,一位记者深入阿比林基地,独家揭开了「星际之门」超算的神秘面纱。工人们007赶工,奥特曼、孙正义亲自坐镇,要在这片土地上重塑AI世界格局,这绝对是一场人类未来的豪赌。问题是,他们能赌赢吗?

来自主题: AI资讯
7960 点击    2025-05-24 11:20
英伟达再破世界纪录,每秒1000 token!刚刚,全球最快Llama 4诞生

英伟达再破世界纪录,每秒1000 token!刚刚,全球最快Llama 4诞生

英伟达再破世界纪录,每秒1000 token!刚刚,全球最快Llama 4诞生

英伟达,亲手打破了自己的天花板!刚刚,Blackwell单用户每秒突破了1000个token,在Llama 4 Maverick模型上,再次创下了AI推理的世界纪录。在官博中,团队放出了不少绝密武器。

来自主题: AI资讯
8954 点击    2025-05-23 15:58