摘要
本发明涉及人工智能技术,揭露了一种基于强化学习的机械臂轨迹优化方法。所述方法包括:首先,依据机械臂的关节信息构建连杆坐标系,并在此基础上建立机械臂的运动学模型;其次,搭建一个强化学习环境,其中以机械臂的旋转角和作业目标位姿作为输入状态,并将机器人工作过程中的稳定程度作为关键奖励项;接着,通过预训练的机械臂作业控制模型,执行基于姿势奖励和质心奖励的决策生成操作,从而生成机器人动作指令;最后,根据这些动作指令对目标机械臂机器人进行精确控制。本发明通过这种轨迹规划方法,实现了机器人运动的稳定性提升。