AI资讯新闻榜单内容搜索-CPU

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: CPU
把注意力计算丢给CPU,大模型解码吞吐量提高1.76~4.99倍

把注意力计算丢给CPU,大模型解码吞吐量提高1.76~4.99倍

把注意力计算丢给CPU,大模型解码吞吐量提高1.76~4.99倍

CPU+GPU,模型KV缓存压力被缓解了。 来自CMU、华盛顿大学、Meta AI的研究人员提出MagicPIG,通过在CPU上使用LSH(局部敏感哈希)采样技术,有效克服了GPU内存容量限制的问题。

来自主题: AI技术研报
7335 点击    2024-12-28 11:38
英伟达年终核弹!全新B300为o1推理大模型打造,RTX5090也曝光了

英伟达年终核弹!全新B300为o1推理大模型打造,RTX5090也曝光了

英伟达年终核弹!全新B300为o1推理大模型打造,RTX5090也曝光了

GPU新核弹B300,以及附带CPU的超级芯片GB300。 高算力,在产品层面上相比B200在FLOPS上提高50% 大显存,从192GB提升到288GB,也是提高了50%。

来自主题: AI资讯
7130 点击    2024-12-26 16:00
AI浪潮下算力需求井喷,谁能在这一轮新型基础设施下拔得头筹

AI浪潮下算力需求井喷,谁能在这一轮新型基础设施下拔得头筹

AI浪潮下算力需求井喷,谁能在这一轮新型基础设施下拔得头筹

联想第六代“海神”液冷技术,已实现支持多类型GPU、CPU,散热效率可达98%,PUE最佳可降至1.1,极大降低了数据中心的能耗水平。

来自主题: AI资讯
7086 点击    2024-12-21 11:40
英伟达下代RTX 50系列显卡规格被泄露,旗舰5090显存达32GB

英伟达下代RTX 50系列显卡规格被泄露,旗舰5090显存达32GB

英伟达下代RTX 50系列显卡规格被泄露,旗舰5090显存达32GB

明年的国际消费类电子产品展览会(CES 2025)将在北京时间 1 月 8 日至 11 日举行,包括英特尔、英伟达和 AMD 在内的各大 CPU、GPU 厂商将带着自家最新产品闪亮登场。

来自主题: AI资讯
7055 点击    2024-12-18 14:25
神级项目训练GPT-2仅需5分钟,Andrej Karpathy都点赞

神级项目训练GPT-2仅需5分钟,Andrej Karpathy都点赞

神级项目训练GPT-2仅需5分钟,Andrej Karpathy都点赞

今年 4 月,AI 领域大牛 Karpathy 一个仅用 1000 行代码即可在 CPU/fp32 上实现 GPT-2 训练的项目「llm.c」曾经引发机器学习社区的热烈讨论。

来自主题: AI资讯
5696 点击    2024-11-22 10:18
为什么AI对GPU的要求高,而不是CPU?

为什么AI对GPU的要求高,而不是CPU?

为什么AI对GPU的要求高,而不是CPU?

在人工智能(AI)领域,特别是深度学习和神经网络训练中,GPU(图形处理单元)已经成为不可或缺的硬件。但为什么AI对GPU的要求高,而不是CPU(中央处理单元)呢?让我们通过一个生动的比喻来揭开这个谜团。

来自主题: AI资讯
4288 点击    2024-11-04 09:52
原来AI手机是被CPU卡了脖子

原来AI手机是被CPU卡了脖子

原来AI手机是被CPU卡了脖子

没错,就是CPU——Central Processing Unit,中央处理器。

来自主题: AI资讯
3132 点击    2024-10-24 10:42
和 AI 恋爱,我输给了赛博小三

和 AI 恋爱,我输给了赛博小三

和 AI 恋爱,我输给了赛博小三

人机恋爱劝退指南 仿生人也会梦到别的女人/男人吗? 看着自己的AI男友突然领着另外一个女人,刘彤感觉自己CPU烧了。

来自主题: AI资讯
4211 点击    2024-10-19 16:09