AI资讯新闻榜单内容搜索-压缩

它来了，剑桥最新LLM提示词压缩调查报告

别说Prompt压缩不重要，你可以不在乎Token成本，但总要考虑内存和LLM响应时间吧？一个显著的问题逐渐浮出水面：随着任务复杂度增加，提示词（Prompt）往往需要变得更长，以容纳更多详细需求、上下文信息和示例。这不仅降低了推理速度，还会增加内存开销，影响用户体验。

来自主题: AI资讯

11242 点击 2024-10-29 12:28

大模型引领6G革命！最新综述探索「未来通信方式」：九大方向，覆盖多模态、RAG等

大语言模型（LLM）正在推动通信行业向智能化转型，在自动生成网络配置、优化网络管理和预测网络流量等方面展现出巨大潜力。未来，LLM在电信领域的应用将需要克服数据集构建、模型部署和提示工程等挑战，并探索多模态集成、增强机器学习算法和经济高效的模型压缩技术。

来自主题: AI技术研报

6114 点击 2024-10-18 13:40

腾讯混元大模型负责人王迪：揭秘万亿 MoE 系统工程之道｜智者访谈

人工智能正经历一场由大模型引发的革命。这些拥有数十亿甚至万亿参数的庞然大物，正在重塑我们对 AI 能力的认知，也构筑起充满挑战与机遇的技术迷宫——从计算集群高速互联网络的搭建，到训练过程中模型稳定性和鲁棒性的提升，再到探索更快更优的压缩与加速方法，每一步都是对创新者的考验。

来自主题: AI资讯

12760 点击 2024-08-21 14:13

2B多模态新SOTA！华科、华南理工发布Mini-Monkey，专治「切分增大分辨率」后遗症

Mini-Monkey 是一个轻量级的多模态大型语言模型，通过采用多尺度自适应切分策略（MSAC）和尺度压缩机制（SCM），有效缓解了传统图像切分策略带来的锯齿效应，提升了模型在高分辨率图像处理和文档理解任务的性能。它在多项基准测试中取得了领先的成绩，证明了其在多模态理解和文档智能领域的潜力。

来自主题: AI技术研报

6043 点击 2024-08-12 17:18

70倍极致压缩！大模型的检查点再多也不怕

大模型作为当下 AI 工业界和学术界当之无愧的「流量之王」，吸引了大批学者和企业投入资源去研究与训练。随着规模越做越大，系统和工程问题已经成了大模型训练中绕不开的难题。例如在 Llama3.1 54 天的训练里，系统会崩溃 466 次，平均 2.78 小时一次！

来自主题: AI技术研报

10275 点击 2024-08-05 14:04

单卡搞定Llama 3.1 405B，让大模型轻松瘦身！超强压缩工具包来了

单卡搞定Llama 3.1（405B），最新大模型压缩工具来了！

来自主题: AI技术研报

11774 点击 2024-08-02 14:26

万字技术干货！LLM工程师必读量化指南，可视化图解揭秘大模型如何压缩

面对LLM逐渐膨胀的参数规模，没有H100的开发者和研究人员们想出了很多弥补方法，「量化」技术就是其中的一种。这篇可视化指南用各种图解，将「量化」的基本概念和分支方法进行了全方位总结。

来自主题: AI技术研报

11168 点击 2024-07-31 16:21

中科大联合华为诺亚提出Entropy Law，揭秘大模型性能、数据压缩率以及训练损失关系

数据是大语言模型（LLMs）成功的基石，但并非所有数据都有益于模型学习。

来自主题: AI技术研报

10865 点击 2024-07-22 14:55

CVPR 2024 Highlight | 北航等发布「时间特征维护」：无需训练，极致压缩加速Diffusion

拯救4bit扩散模型精度，仅需时间特征维护——以超低精度量化技术重塑图像内容生成！

来自主题: AI技术研报

11328 点击 2024-06-20 11:26

大模型压缩量化方案怎么选？无问芯穹Qllm-Eval量化方案全面评估：多模型、多参数、多维度

基于 Transformer架构的大型语言模型在各种基准测试中展现出优异性能，但数百亿、千亿乃至万亿量级的参数规模会带来高昂的服务成本。例如GPT-3有1750亿参数，采用FP16存储，模型大小约为350GB，而即使是英伟达最新的B200 GPU 内存也只有192GB ，更不用说其他GPU和边缘设备。

来自主题: AI技术研报

11164 点击 2024-06-19 23:30