无需训练实现价值观实时动态对齐:上交开源价值观对齐方法OPO,闭源与开源大模型均适用 关键词: 模型训练,大模型对齐,GAIR,OPO OPO 无需训练即可实现实时动态对齐,而且因其即插即用的特性,适用于所有的开源与闭源大模型。 来自主题: AI技术研报 6847 点击 2024-01-23 15:03