GUI智能体训练迎来新范式!半在线强化学习让7B模型媲美GPT-4o GUI智能体训练迎来新范式!半在线强化学习让7B模型媲美GPT-4o 关键词: 模型训练,UI-S1,GUI,半在线强化学习 浙江大学与通义实验室Mobile-Agent团队在UI-R1的基础上,推出全新研究成果——UI-S1,提出了一种名为半在线强化学习(Semi-online Reinforcement Learning)的创新训练范式。 来自主题: AI技术研报 5974 点击 2025-09-24 09:49