AI资讯新闻榜单内容搜索-内存

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 内存

处理器AI性能平白“翻倍”？错误报道背后的故事

处理器AI性能平白“翻倍”？错误报道背后的故事

处理器AI性能平白“翻倍”？错误报道背后的故事

2024年4月下旬，AMD方面发布了锐龙8000系列的专业向桌面版产品线，也就是锐龙PRO的8000系列家族。与大家熟知的“普通版”锐龙8000系列相比，“专业线”的锐龙PRO 8000系列其实变化并不大，它们主要是增加了对于微软安全处理器（Microsoft Pluton）、ECC内存、安全虚拟化，以及远程管理等专业功能的支持。

来自主题: AI资讯

9422 点击 2024-04-29 11:19

谷歌：假如AI大模型支持无限长上下文，会如何？

谷歌：假如AI大模型支持无限长上下文，会如何？

谷歌：假如AI大模型支持无限长上下文，会如何？

为解决大模型（LLMs）在处理超长输入序列时遇到的内存限制问题，本文作者提出了一种新型架构：Infini-Transformer，它可以在有限内存条件下，让基于Transformer的大语言模型（LLMs）高效处理无限长的输入序列。实验结果表明：Infini-Transformer在长上下文语言建模任务上超越了基线模型，内存最高可节约114倍。

来自主题: AI资讯

9891 点击 2024-04-14 11:32

AI在用：万万没想到，科技论文还能这么读

AI在用：万万没想到，科技论文还能这么读

AI在用：万万没想到，科技论文还能这么读

laude 3 具有非常大的内存（ 200k 上下文窗口）和很强的调用准确性，它的上下文能力也因此成为最受欢迎、应用最广的技能。我们介绍过如何利用这种能力，没时间收听播客也能获取核心内容。今天，我们再介绍一个新技能，帮助技术小白快速 get 最新、最前沿的科技成果

来自主题: AI资讯

8508 点击 2024-04-11 10:48

华为诺亚频域LLM「帝江」：仅需1/50训练成本，7B模型媲美LLaMA，推理加速5倍

华为诺亚频域LLM「帝江」：仅需1/50训练成本，7B模型媲美LLaMA，推理加速5倍

华为诺亚频域LLM「帝江」：仅需1/50训练成本，7B模型媲美LLaMA，推理加速5倍

基于 Transformer 架构的大语言模型在 NLP 领域取得了令人惊艳的效果，然而，Transformer 中自注意力带来的二次复杂度使得大模型的推理成本和内存占用十分巨大，特别是在长序列的场景中。

来自主题: AI技术研报

6786 点击 2024-04-03 17:29

田渊栋等人新作：突破内存瓶颈，让一块4090预训练7B大模型

田渊栋等人新作：突破内存瓶颈，让一块4090预训练7B大模型

田渊栋等人新作：突破内存瓶颈，让一块4090预训练7B大模型

3 月 6 日，田渊栋又一项研究出炉，这次，他们主攻 LLM 内存效率。除了田渊栋本人，还有来自加州理工学院、德克萨斯大学奥斯汀分校以及 CMU 的研究者。

来自主题: AI技术研报

11728 点击 2024-03-08 15:07

ICLR 2024 Spotlight | 大语言模型权重、激活的全方位低bit可微量化，已集成进商用APP

ICLR 2024 Spotlight | 大语言模型权重、激活的全方位低bit可微量化，已集成进商用APP

ICLR 2024 Spotlight | 大语言模型权重、激活的全方位低bit可微量化，已集成进商用APP

模型量化是模型压缩与加速中的一项关键技术，其将模型权重与激活值量化至低 bit，以允许模型占用更少的内存开销并加快推理速度。对于具有海量参数的大语言模型而言，模型量化显得更加重要。

来自主题: AI技术研报

9844 点击 2024-03-07 13:53

陈丹琦团队新作：Llama-2上下文扩展至128k，10倍吞吐量仅需1/6内存

陈丹琦团队新作：Llama-2上下文扩展至128k，10倍吞吐量仅需1/6内存

陈丹琦团队新作：Llama-2上下文扩展至128k，10倍吞吐量仅需1/6内存

陈丹琦团队刚刚发布了一种新的LLM上下文窗口扩展方法：它仅用8k大小的token文档进行训练，就能将Llama-2窗口扩展至128k。

来自主题: AI技术研报

11265 点击 2024-02-29 13:27

存储，战火重燃

存储，战火重燃

存储，战火重燃

英伟达的产能上不来，很大程度上是因为HBM（高带宽内存）不够用了。每一块H100芯片，都会用到6颗HBM。当下，SK海力士、三星供应了90%的HBM，并且技术领先美光整整一个代际。

来自主题: AI资讯

7387 点击 2024-02-20 17:07

推倒万亿参数大模型内存墙，万字长文：从第一性原理看神经网络量化

推倒万亿参数大模型内存墙，万字长文：从第一性原理看神经网络量化

推倒万亿参数大模型内存墙，万字长文：从第一性原理看神经网络量化

为了应对大模型不断复杂的推理和训练，英伟达、AMD、英特尔、谷歌、微软、Meta、Arm、高通、MatX以及Lemurian Labs，纷纷开始研发全新的硬件解决方案。

来自主题: AI技术研报

8972 点击 2024-02-17 11:06

进我的收藏夹吃灰吧：大模型加速超全指南来了

进我的收藏夹吃灰吧：大模型加速超全指南来了

进我的收藏夹吃灰吧：大模型加速超全指南来了

2023 年，大型语言模型（LLM）以其强大的生成、理解、推理等能力而持续受到高度关注。然而，训练和部署 LLM 非常昂贵，需要大量的计算资源和内存，因此研究人员开发了许多用于加速 LLM 预训练、微调和推理的方法。

来自主题: AI技术研报

4808 点击 2024-02-09 14:05

上一页当前第12页,共13页下一页