告别专家依赖,让机器人学会自我参考,仅需200步性能飙升至99.2% 告别专家依赖,让机器人学会自我参考,仅需200步性能飙升至99.2% 关键词: OpenMoss,模型训练,SRPO,自参考策略优化框架 你是否想过,机器人也能像人一样,从失败中学习,不断自我提升? 来自主题: AI技术研报 9797 点击 2025-12-11 10:08