UCLA华人提出全新自我对弈机制!LLM自己训自己,效果碾压GPT-4专家指导
UCLA华人提出全新自我对弈机制!LLM自己训自己,效果碾压GPT-4专家指导来自UCLA的华人团队提出一种全新的LLM自我对弈系统,能够让LLM自我合成数据,自我微调提升性能,甚至超过了用GPT-4作为专家模型指导的效果。
来自主题: AI技术研报
6044 点击 2024-02-02 17:27
来自UCLA的华人团队提出一种全新的LLM自我对弈系统,能够让LLM自我合成数据,自我微调提升性能,甚至超过了用GPT-4作为专家模型指导的效果。