基于元强化学习的机械臂控制方法和装置、设备及介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于元强化学习的机械臂控制方法和装置、设备及介质
申请号:CN202511226596
申请日期:2025-08-29
公开号:CN120941397A
公开日期:2025-11-14
类型:发明专利
摘要
本申请实施例提供了一种基于元强化学习的机械臂控制方法和装置、设备及介质,属于机械臂控制技术领域。该方法包括:获取机械臂控制任务的历史交互数据;基于历史交互数据,对机械臂控制任务进行特征提取,得到任务特征;基于所述任务特征,通过预设策略网络确定目标机械臂动作;通过预设优势函数对所述目标机械臂动作计算优势值,得到目标动作优势;对目标动作优势进行归一化处理,得到目标动作权重;基于目标动作权重,对预设策略网络进行参数更新,得到目标策略网络;利用目标策略网络进行机械臂控制。本申请实施例能够提高机械臂控制方法的泛化能力。
技术关键词
机械臂控制方法 策略 机械臂控制装置 机械臂控制技术 参数更新模块 推理网络 可读存储介质 特征提取模块 数据获取模块 状态更新 电子设备 处理器 存储器 计算机 控制模块