微调都不要了?3个样本、1个提示搞定LLM对齐,提示工程师:全都回来了
微调都不要了?3个样本、1个提示搞定LLM对齐,提示工程师:全都回来了大模型的效果好不好,有时候对齐调优很关键。但近来很多研究开始探索无微调的方法,艾伦人工智能研究所和华盛顿大学的研究者用「免调优」对齐新方法超越了使用监督调优(SFT)和人类反馈强化学习(RLHF)的 LLM 性能。
来自主题: AI资讯
6496 点击 2023-12-06 15:17
大模型的效果好不好,有时候对齐调优很关键。但近来很多研究开始探索无微调的方法,艾伦人工智能研究所和华盛顿大学的研究者用「免调优」对齐新方法超越了使用监督调优(SFT)和人类反馈强化学习(RLHF)的 LLM 性能。
微软最新研究再次证明了提示工程的威力——无需额外微调,无需专家策划,仅凭提示,GPT-4就能化身“专家”。
商汤医疗健康大模型「大医」升级,诊断用药病历随访一条龙服务!国内首款支持提示工程自定义,预设13种场景,打造行业标杆。