AI资讯新闻榜单内容搜索-模型训练

LLM上下文窗口突破200万！无需架构变化+复杂微调，轻松扩展8倍

大型语言模型（LLM）往往会追求更长的「上下文窗口」，但由于微调成本高、长文本稀缺以及新token位置引入的灾难值（catastrophic values）等问题，目前模型的上下文窗口大多不超过128k个token

来自主题: AI技术研报

9408 点击 2024-04-29 20:31

训练模型搞得跟《饥饿游戏》似的，全球AI研究者，都在苦恼怎么才能喂饱这群数据大胃王。

来自主题: AI技术研报

7257 点击 2024-04-29 20:06

近期，大语言模型、文生图模型等大规模 AI 模型迅猛发展。在这种形势下，如何适应瞬息万变的需求，快速适配大模型至各类下游任务，成为了一个重要的挑战。受限于计算资源，传统的全参数微调方法可能会显得力不从心，因此需要探索更高效的微调策略。

来自主题: AI技术研报

11309 点击 2024-04-28 15:07

指代分割 (Referring Image Segmentation，RIS) 是一项极具挑战性的多模态任务，要求算法能够同时理解精细的人类语言和视觉图像信息，并将图像中句子所指代的物体进行像素级别的分割。

来自主题: AI技术研报

11070 点击 2024-04-28 13:46

奔向通用人工智能，大模型又迈出一大步。

来自主题: AI技术研报

11431 点击 2024-04-28 12:19

大模型语料是指用于训练和评估大模型的一系列文本、语音或其他模态的数据。

来自主题: AI技术研报

6715 点击 2024-04-28 11:12

视觉语言模型屡屡出现新突破，但ViT仍是图像编码器的首选网络结构。

来自主题: AI技术研报

6634 点击 2024-04-27 12:15

指代分割 (Referring Image Segmentation，RIS) 是一项极具挑战性的多模态任务，要求算法能够同时理解精细的人类语言和视觉图像信息，并将图像中句子所指代的物体进行像素级别的分割。

来自主题: AI技术研报

7623 点击 2024-04-26 17:24

奔向通用人工智能，大模型又迈出一大步。

来自主题: AI技术研报

8663 点击 2024-04-26 17:11

大模型语料是指用于训练和评估大模型的一系列文本、语音或其他模态的数据。语料规模和质量对大模型性能以及应用的深度、广度有着至关重要的影响。

来自主题: AI技术研报

10086 点击 2024-04-26 16:56