UCLA华人提出全新自我对弈机制!LLM自己训自己,效果碾压GPT-4专家指导 关键词: 微调,大模型训练,对弈机制,GPT-4 来自UCLA的华人团队提出一种全新的LLM自我对弈系统,能够让LLM自我合成数据,自我微调提升性能,甚至超过了用GPT-4作为专家模型指导的效果。 来自主题: AI技术研报 5828 点击 2024-02-02 17:27