AI资讯新闻榜单内容搜索-模型训练

月之暗面对谈 Zilliz：长文本和 RAG 如何选择？

关于长文本和 RAG 到底如何选择，一直有争论，从基模公司到应用开发者。今天这篇文章，是来自基模公司月之暗面和中间层 Zilliz 的技术对话，值得一看。

来自主题: AI资讯

8236 点击 2024-08-13 13:42

ECCV 2024 | 南洋理工三维数字人生成新范式：结构扩散模型

三维数字人生成和编辑在数字孪生、元宇宙、游戏、全息通讯等领域有广泛应用。传统三维数字人制作往往费时耗力，近年来研究者提出基于三维生成对抗网络（3D GAN）从 2D 图像中学习三维数字人，极大提高了数字人制作效率。

来自主题: AI资讯

4337 点击 2024-08-12 17:55

2B多模态新SOTA！华科、华南理工发布Mini-Monkey，专治「切分增大分辨率」后遗症

Mini-Monkey 是一个轻量级的多模态大型语言模型，通过采用多尺度自适应切分策略（MSAC）和尺度压缩机制（SCM），有效缓解了传统图像切分策略带来的锯齿效应，提升了模型在高分辨率图像处理和文档理解任务的性能。它在多项基准测试中取得了领先的成绩，证明了其在多模态理解和文档智能领域的潜力。

来自主题: AI技术研报

4652 点击 2024-08-12 17:18

比Stable Diffusion便宜118倍！1890美元训出11.6亿参数高质量文生图模型

近日，来自加州大学尔湾分校等机构的研究人员，利用延迟掩蔽、MoE、分层扩展等策略，将扩散模型的训练成本降到了1890美元。

来自主题: AI资讯

7676 点击 2024-08-12 17:11

30行代码，500万长文本推理提速8倍！「树注意力」让GPU越多省的越多

跨GPU的注意力并行，最高提速8倍，支持512万序列长度推理。

来自主题: AI技术研报

8782 点击 2024-08-12 13:50

黑匣子被打开了！能玩的Transformer可视化解释工具，本地运行GPT-2、还可实时推理

2017 年，谷歌在论文《Attention is all you need》中提出了 Transformer，成为了深度学习领域的重大突破。该论文的引用数已经将近 13 万，后来的 GPT 家族所有模型也都是基于 Transformer 架构，可见其影响之广。作为一种神经网络架构，Transformer 在从文本到视觉的多样任务中广受欢迎，尤其是在当前火热的 AI 聊天机器人领域。

来自主题: AI资讯

6680 点击 2024-08-11 17:38