匿名论文提出奇招!增强大模型长文本能力居然还能这么做 匿名论文提出奇招!增强大模型长文本能力居然还能这么做 关键词: 大模型,长文本能力,Lora,Temp-Lora 来看一个奇妙新解:和长度外推等方法使用KV缓存的本质不同,它用模型的参数来存储大量上下文信息。 来自主题: AI技术研报 6195 点击 2024-02-02 16:12