仅需600多条数据,就能训练自己的长输出模型了?!
来自主题: AI技术研报
5958 点击 2024-09-27 18:33
仅需600多条数据,就能训练自己的长输出模型了?!
虽然大语言模型(LLM)的能力不断突破,但在长文生成方面却一直存在瓶颈。近日,清华大学和智谱AI联合发布的最新研究成果,为解决这一难题提供了创新方案。这项名为"LongWriter"的技术,成功将AI模型的长文生成能力从约2000字提升至10000字以上,同时保持了高质量输出。这一成果通过创新的数据构建方法、模型训练策略和评估基准,为AI长文创作开辟了新天地。