“大海捞针”out!“数星星”成测长文本能力更精准方法,来自鹅厂 关键词: MLPD,长文本能力,模型训练,GPT-4。Kimi Chat 大模型长文本能力测试,又有新方法了! 来自主题: AI技术研报 7960 点击 2024-04-02 11:36
上海交大新框架解锁CLIP长文本能力,多模态生成细节拿捏,图像检索能力显著提升 关键词: CLIP,长文本能力,多模态,模型训练 CLIP长文本能力被解锁,图像检索任务表现显著提升!一些关键细节也能被捕捉到。上海交大联合上海AI实验室提出新框架Long-CLIP。 来自主题: AI技术研报 7880 点击 2024-04-01 11:26
匿名论文提出奇招!增强大模型长文本能力居然还能这么做 关键词: 大模型,长文本能力,Lora,Temp-Lora 来看一个奇妙新解:和长度外推等方法使用KV缓存的本质不同,它用模型的参数来存储大量上下文信息。 来自主题: AI技术研报 5856 点击 2024-02-02 16:12