基于智能体训练的奖励生成方法及相关装置
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
验证码登录
×
发送
登录即代表您已同意AITNT
用户协议
和
隐私政策
登录
登录成功后会自动刷新界面
AI新闻日报
AITNT公众号
AITNT交流群
搜索
未登录
首页
AI中心
退出
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI 源力市场
寻求报道
基于智能体训练的奖励生成方法及相关装置
申请号:
CN202511195408
申请日期:
2025-08-25
公开号:
CN121031708A
公开日期:
2025-11-28
类型:
发明专利
摘要
本公开提供一种基于智能体训练的奖励生成方法及相关装置,涉及计算机技术领域。该方法为:对结构化环境数据进行处理,获得不同维度的局部奖励信息;所述结构化环境数据为对智能体针对的外部环境所采集的外接环境数据处理后所获得的;对不同维度的奖励的权重信息进行调整,获得不同维度的奖励的融合权重信息;根据所述不同维度的局部奖励信息和不同维度的奖励的融合权重信息,确定综合奖励信息,以基于所述综合奖励信息对所述智能体进行策略更新。
技术关键词
策略更新
生成方法
轻量化神经网络
数据
输入接口
计算机程序产品
处理器
复杂度
生成装置
动态
处理单元
非线性
阶段
电子设备
指令
存储器
在线
场景
周期
参数