基于模仿学习的机器人技能持续学习方法和装置

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于模仿学习的机器人技能持续学习方法和装置
申请号:CN202411975691
申请日期:2024-12-30
公开号:CN119589681B
公开日期:2025-06-24
类型:发明专利
摘要
本公开涉及一种基于模仿学习的机器人技能持续学习方法和装置,所述方法包括:依次针对多个任务中的每个任务,在满足预设终止条件之前循环执行以下操作:将观测图像、状态信息、预先获取的当前任务的文本指令、以及当前任务的技能编码本输入到模仿学习策略网络,预测得到当前时刻机器人的动作信息,其中,当前任务的技能编码本是预先初始化的多个可学习的子技能向量,在具有先前任务的情况下,包含先前任务的技能编码本的技能信息;基于预测得到的机器人的动作信息和专家演示数据中机器人的真实动作信息计算损失;基于损失对模仿学习策略网络和当前任务的技能编码本进行更新。解决了技能选择不灵活、人为设计技能难以抽象子技能层次结构等问题。
技术关键词
持续学习方法 机器人 注意力 状态编码器 参数更新模块 多模态 高斯混合模型 文本编码器 多层感知机 网络 解码器 图像 检查点 指令 学习装置 矩阵 数据