微调都不要了?3个样本、1个提示搞定LLM对齐,提示工程师:全都回来了 微调都不要了?3个样本、1个提示搞定LLM对齐,提示工程师:全都回来了 关键词: 微调,对齐,提示词,LLM,提示工程师 大模型的效果好不好,有时候对齐调优很关键。但近来很多研究开始探索无微调的方法,艾伦人工智能研究所和华盛顿大学的研究者用「免调优」对齐新方法超越了使用监督调优(SFT)和人类反馈强化学习(RLHF)的 LLM 性能。 来自主题: AI资讯 6885 点击 2023-12-06 15:17