AI资讯新闻榜单内容搜索-内存

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 内存

AMD GPU性能暴涨7倍，优化算法首次开源！高效MoE支持任意专家数量

AMD GPU性能暴涨7倍，优化算法首次开源！高效MoE支持任意专家数量

AMD GPU性能暴涨7倍，优化算法首次开源！高效MoE支持任意专家数量

通过完全启用并发多块执行，支持任意专家数量（MAX_EXPERT_NUMBER==256），并积极利用共享内存（5kB LDS）和寄存器（52 VGPRs，48 SGPRs），MoE Align & Sort逻辑被精心设计，实现了显著的性能提升：A100提升3倍，H200提升3倍，MI100提升10倍，MI300X/MI300A提升7倍...

来自主题: AI技术研报

4181 点击 2025-04-03 16:14

新注意力让大模型上下文内存占用砍半！精度不减还能加速2倍

新注意力让大模型上下文内存占用砍半！精度不减还能加速2倍

新注意力让大模型上下文内存占用砍半！精度不减还能加速2倍

大模型同样的上下文窗口，只需一半内存就能实现，而且精度无损？前苹果ASIC架构师Nils Graef，和一名UC伯克利在读本科生一起提出了新的注意力机制Slim Attention。

来自主题: AI资讯

7182 点击 2025-03-17 19:52

DeepSeek前实习生魔改MoE，用迭代机制把内存需求砍了42%，团队：“免费午餐”优化方法

DeepSeek前实习生魔改MoE，用迭代机制把内存需求砍了42%，团队：“免费午餐”优化方法

DeepSeek前实习生魔改MoE，用迭代机制把内存需求砍了42%，团队：“免费午餐”优化方法

DeepSeek MoE“变体”来了，200美元以内，内存需求减少17.6-42%！名叫CoE（Chain-of-Experts），被认为是一种“免费午餐”优化方法，突破了MoE并行独立处理token、整体参数数量较大需要大量内存资源的局限。

来自主题: AI技术研报

6700 点击 2025-03-04 20:02

韩国芯片，危险

韩国芯片，危险

韩国芯片，危险

2月26日，美光宣布已率先向生态系统合作伙伴及特定客户出货专为下一代CPU设计的 1γ(1-gamma) 第六代 (10纳米级) DRAM节点DDR5内存样品。

来自主题: AI资讯

6397 点击 2025-03-04 09:50

DeepSeek关键RL算法GRPO，有人从头跑通了，贡献完整代码

DeepSeek关键RL算法GRPO，有人从头跑通了，贡献完整代码

DeepSeek关键RL算法GRPO，有人从头跑通了，贡献完整代码

GRPO（Group Relative Policy Optimization）是 DeepSeek-R1 成功的基础技术之一，我们之前也多次报道过该技术，比如《DeepSeek 用的 GRPO 占用大量内存？有人给出了些破解方法》。

来自主题: AI技术研报

9387 点击 2025-03-02 15:14

DeepSeek-R1推理本地跑，7GB GPU体验啊哈时刻？GRPO内存暴降，GitHub超2万星

DeepSeek-R1推理本地跑，7GB GPU体验啊哈时刻？GRPO内存暴降，GitHub超2万星

DeepSeek-R1推理本地跑，7GB GPU体验啊哈时刻？GRPO内存暴降，GitHub超2万星

黑科技来了！开源LLM微调神器Unsloth近期更新，将GRPO训练的内存使用减少了80%！只需7GB VRAM，本地就能体验AI「啊哈时刻」。

来自主题: AI资讯

9525 点击 2025-02-09 21:29

DeepSeek用的GRPO占用大量内存？有人给出了些破解方法

DeepSeek用的GRPO占用大量内存？有人给出了些破解方法

DeepSeek用的GRPO占用大量内存？有人给出了些破解方法

自 DeepSeek-R1 发布以来，群组相对策略优化（GRPO）因其有效性和易于训练而成为大型语言模型强化学习的热门话题。R1 论文展示了如何使用 GRPO 从遵循 LLM（DeepSeek-v3）的基本指令转变为推理模型（DeepSeek-R1）。

来自主题: AI技术研报

7025 点击 2025-02-07 16:53

LLaVA-Mini来了！每张图像所需视觉token压缩至1个，兼顾效率内存

LLaVA-Mini来了！每张图像所需视觉token压缩至1个，兼顾效率内存

LLaVA-Mini来了！每张图像所需视觉token压缩至1个，兼顾效率内存

以 GPT-4o 为代表的实时交互多模态大模型（LMMs）引发了研究者对高效 LMM 的广泛关注。现有主流模型通过将视觉输入转化为大量视觉 tokens，并将其嵌入大语言模型（LLM）上下文来实现视觉信息理解。

来自主题: AI技术研报

3913 点击 2025-02-06 15:26

阶跃公开了自家新型注意力机制：KV缓存消耗直降93.7%，性能不减反增

阶跃公开了自家新型注意力机制：KV缓存消耗直降93.7%，性能不减反增

阶跃公开了自家新型注意力机制：KV缓存消耗直降93.7%，性能不减反增

随着当前大语言模型的广泛应用和推理时扩展的新范式的崛起，如何实现高效的大规模推理成为了一个巨大挑战。特别是在语言模型的推理阶段，传统注意力机制中的键值缓存（KV Cache）会随着批处理大小和序列长度线性增长，俨然成为制约大语言模型规模化应用和推理时扩展的「内存杀手」。

来自主题: AI技术研报

7547 点击 2025-01-18 09:57

美国防部拨款1860万美元：存算一体端侧AI推理芯片！

美国防部拨款1860万美元：存算一体端侧AI推理芯片！

美国防部拨款1860万美元：存算一体端侧AI推理芯片！

由普林斯顿大学教授共同创立的一家AI初创公司获得了1860万美元的国防部拨款，用于开发一种内存芯片，该芯片旨在提供更快、更高效的AI推理处理。

来自主题: AI资讯

8546 点击 2025-01-08 10:43

上一页当前第5页,共10页下一页