AI资讯新闻榜单内容搜索-压缩

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 压缩
70%大小,100%准确!完美压缩LLM性能0损失,推理速度最高飙升39倍

70%大小,100%准确!完美压缩LLM性能0损失,推理速度最高飙升39倍

70%大小,100%准确!完美压缩LLM性能0损失,推理速度最高飙升39倍

LLM的规模爆炸式增长,传统量化技术虽能压缩模型,却以牺牲精度为代价。莱斯大学团队的最新研究DFloat11打破这一僵局:它将模型压缩30%且输出与原始模型逐位一致!更惊艳的是,通过针对GPU的定制化解压缩内核,DFloat11使推理吞吐量提升最高38.8倍。

来自主题: AI技术研报
9495 点击    2025-04-28 09:05
Transformer+Mamba黄金组合!长文推理性能飙升3倍,性能还更强

Transformer+Mamba黄金组合!长文推理性能飙升3倍,性能还更强

Transformer+Mamba黄金组合!长文推理性能飙升3倍,性能还更强

Nemotron-H模型混合了Transformer和Mamba架构,使长文本推理速度提升3倍,同时还能保持高性能,开源版本包括8B和56B尺寸。训练过程采用FP8训练和压缩技术,进一步提高了20%推理速度

来自主题: AI产品测评
9666 点击    2025-04-20 20:47
聚焦个性化学习,夸克不想做一个千篇一律的“AI+教育”

聚焦个性化学习,夸克不想做一个千篇一律的“AI+教育”

聚焦个性化学习,夸克不想做一个千篇一律的“AI+教育”

从人们被大模型“震撼”完开始思考如何把这项技术用起来的第一天,教育就是被很多人天然想到的场景。一个能压缩全世界知识的AI,天然就是一个人类想象里“老师”的样子。

来自主题: AI资讯
9568 点击    2025-04-17 13:58
诺奖得主震撼宣言:AI一年完成10亿年「博士研究时间」!

诺奖得主震撼宣言:AI一年完成10亿年「博士研究时间」!

诺奖得主震撼宣言:AI一年完成10亿年「博士研究时间」!

诺奖得主Demis Hassabis表示,通过AI,DeepMind团队在一年里,完成了10亿年的博士研究时间!10亿年的科学探索被压缩到了一年之内,或许这才代表了AI技术的最高使命。

来自主题: AI资讯
8780 点击    2025-04-15 10:25
速递|Pruna AI开源模型压缩"工具箱",已完成种子轮融资650万美元

速递|Pruna AI开源模型压缩"工具箱",已完成种子轮融资650万美元

速递|Pruna AI开源模型压缩"工具箱",已完成种子轮融资650万美元

欧洲初创公司 Pruna AI 一直在研究 AI 模型的压缩算法,该公司的优化框架将于周四开源。Pruna AI 在几个月前完成了 650 万美元的种子轮融资。参与此次初创公司投资的包括 EQT Ventures、Daphni、Motier Ventures 以及 Kima Ventures。

来自主题: AI资讯
9461 点击    2025-03-21 14:28
不到十分钟,用 谜境 Agent 即可轻松创建互动小说

不到十分钟,用 谜境 Agent 即可轻松创建互动小说

不到十分钟,用 谜境 Agent 即可轻松创建互动小说

国内首款全流程 AI 互动小说创作工具「谜境 Agent」于近日上线,该工具通过整合剧本生成、美术绘制、交互设计等模块,将传统需要 4-6 个月的开发周期压缩至 10 分钟内完成。

来自主题: AI资讯
6514 点击    2025-03-17 09:50
DeepSeek的MLA,任意大模型都能轻松迁移了

DeepSeek的MLA,任意大模型都能轻松迁移了

DeepSeek的MLA,任意大模型都能轻松迁移了

DeepSeek-R1 作为 AI 产业颠覆式创新的代表轰动了业界,特别是其训练与推理成本仅为同等性能大模型的数十分之一。多头潜在注意力网络(Multi-head Latent Attention, MLA)是其经济推理架构的核心之一,通过对键值缓存进行低秩压缩,显著降低推理成本 [1]。

来自主题: AI技术研报
6748 点击    2025-03-07 10:24
LLaVA-Mini来了!每张图像所需视觉token压缩至1个,兼顾效率内存

LLaVA-Mini来了!每张图像所需视觉token压缩至1个,兼顾效率内存

LLaVA-Mini来了!每张图像所需视觉token压缩至1个,兼顾效率内存

以 GPT-4o 为代表的实时交互多模态大模型(LMMs)引发了研究者对高效 LMM 的广泛关注。现有主流模型通过将视觉输入转化为大量视觉 tokens,并将其嵌入大语言模型(LLM)上下文来实现视觉信息理解。

来自主题: AI技术研报
4895 点击    2025-02-06 15:26
ICLR 2025|高效重建几何精准的大规模复杂三维场景,中科院提出CityGaussianV2

ICLR 2025|高效重建几何精准的大规模复杂三维场景,中科院提出CityGaussianV2

ICLR 2025|高效重建几何精准的大规模复杂三维场景,中科院提出CityGaussianV2

来自中科院自动化所的研究团队提出了用于大规模复杂三维场景的高效重建算法 CityGaussianV2,能够在快速实现训练和压缩的同时,得到精准的几何结构与逼真的实时渲染体验。该论文已接受于 ICLR`2025,其代码也已同步开源。

来自主题: AI技术研报
8074 点击    2025-02-05 13:18