感知错误率降低30.5%:隐式感知损失让模型主动“睁大眼睛” | UIUC&阿里通义 感知错误率降低30.5%:隐式感知损失让模型主动“睁大眼睛” | UIUC&阿里通义 关键词: AI,模型训练,PAPO,多模态模型训练 让大模型在学习推理的同时学会感知。伊利诺伊大学香槟分校(UIUC)与阿里巴巴通义实验室联合推出了全新的专注于多模态推理的强化学习算法PAPO(Perception-Aware Policy Optimization)。 来自主题: AI技术研报 5976 点击 2025-07-11 16:23