率先突破大规模多类数据损坏问题!中科大离线强化学习新方式入选NeurIPS 2024 关键词: 模型训练,AI,强化学习,变分贝叶斯 机器人控制和自动驾驶的离线数据损坏问题有解了! 中科大王杰教授团队 (MIRA Lab) 提出了一种变分贝叶斯推断方法,有效地提升了智能决策模型的鲁棒性。 来自主题: AI技术研报 2784 点击 2024-10-20 11:43