AI资讯新闻榜单内容搜索-压缩

谢赛宁对话Sora 负责人：AI 视觉的基础是对压缩图像的学习

语言将是获得更智能系统的重要组成部分。

来自主题: AI资讯

10231 点击 2024-06-17 19:20

港大北航等1bit大模型引热议，IEEE刊物评“解决AI能源需求”！作者亲自解读在此

极限量化，把每个参数占用空间压缩到1.1bit！

来自主题: AI技术研报

10669 点击 2024-06-09 17:22

不同数据集有不同的Scaling law？而你可用一个压缩算法来预测它

一般而言，训练神经网络耗费的计算量越大，其性能就越好。在扩大计算规模时，必须要做个决定：是增多模型参数量还是提升数据集大小 —— 必须在固定的计算预算下权衡此两项因素。

来自主题: AI技术研报

7631 点击 2024-06-03 17:55

多模态大模型不够灵活，谷歌DeepMind创新架构Zipper：分开训练再「压缩」

最近的一系列研究表明，纯解码器生成模型可以通过训练利用下一个 token 预测生成有用的表征，从而成功地生成多种模态（如音频、图像或状态 - 动作序列）的新序列，从文本、蛋白质、音频到图像，甚至是状态序列。

来自主题: AI技术研报

9719 点击 2024-06-02 14:38

CVPR 2024 Highlight | 基于单曝光压缩成像，不依赖生成模型也能从单张图像中重建三维场景

传统的 3D 重建算法需要不同视角拍摄的多张图片作为输入从而重建出 3D 场景。近年来，有相当多的工作尝试从单张图片构建 3D 场景。然而，绝大多数此类工作都依赖生成式模型（如 Stable Diffusion），换句话说，此类工作仍然需要通过预训练的生成式模型推理场景中的 3D 信息。

来自主题: AI技术研报

12753 点击 2024-05-03 21:00

谷歌爆改Transformer，“无限注意力”让1B小模型读完10部小说，114倍信息压缩

它通过将压缩记忆（compressive memory）整合到线性注意力机制中，用来处理无限长上下文

来自主题: AI资讯

10280 点击 2024-04-13 20:07

北大&火山引擎夺冠！CLIC视频压缩挑战赛结果公布，中国团队表现亮眼

随着以深度学习为代表的新一代人工智能技术不断取得突破，学术界与工业界逐渐意识到人工智能技术在图像、视频压缩领域的巨大应用潜力。

来自主题: AI资讯

7083 点击 2024-04-08 15:16

比LoRA还快50%的微调方法来了！一张3090性能超越全参调优，UIUC联合LMFlow团队提出LISA

2022 年底，随着 ChatGPT 的爆火，人类正式进入了大模型时代。然而，训练大模型需要的时空消耗依然居高不下，给大模型的普及和发展带来了巨大困难。面对这一挑战，原先在计算机视觉领域流行的 LoRA 技术成功转型大模型 [1][2]，带来了接近 2 倍的时间加速和理论最高 8 倍的空间压缩，将微调技术带进千家万户。

来自主题: AI技术研报

10401 点击 2024-04-01 15:45

一口气读完甄嬛传剧本、大部头医书：月之暗面200万字上下文Kimi开启内测

半年时间，月之暗面把 AI 模型支持的上下文长度提升了一个数量级，实现了 200 万字上下文的「无损压缩」。

来自主题: AI资讯

10738 点击 2024-03-19 11:12

总结374篇相关工作，陶大程团队联合港大、UMD发布LLM知识蒸馏最新综述

早在 2020 年，陶大程团队就发布了《Knowledge Distillation: A Survey》，详细介绍了知识蒸馏在深度学习中的应用，主要用于模型压缩和加速。随着大语言模型的出现，知识蒸馏的作用范围不断扩大，逐渐扩展到了用于提升小模型的性能以及模型的自我提升。

来自主题: AI技术研报

6835 点击 2024-03-16 15:28