
从「知题」到「知人」:UserRL让智能体学会「以人为本」
从「知题」到「知人」:UserRL让智能体学会「以人为本」来自 UIUC 与 Salesforce 的研究团队提出了一套系统化方案:UserBench —— 首次将 “用户特性” 制度化,构建交互评测环境,用于专门检验大模型是否真正 “懂人”;UserRL —— 在 UserBench 及其他标准化 Gym 环境之上,搭建统一的用户交互强化学习框架,并系统探索以用户为驱动的奖励建模。
来自主题: AI技术研报
7661 点击 2025-10-08 11:45