摘要
本申请提供了一种人形机器人控制方法、系统以及人形机器人,其中,该方法包括:获取任务指令以及视野图像;将视野图像以及任务指令输入视觉语言感知模型,得到目标物体的三维坐标;获取提示词,并将提示词以及三维坐标输入任务规划器,确定提示词对应的控制信息;通过臂控制模块控制人形机器人的臂部运动,并通过手控制模块控制人形机器人的手部运动,并通过主体控制模块控制人形机器人的腿部运动。本申请能够将视觉感知、语言理解、任务规划、运动控制等多个模块集成到一个统一的框架中,实现了从感知到执行的端到端控制,提高了人形机器人控制过程的集成度,增强了机器人在复杂环境中的适应能力,提高了人形机器人控制过程的透明度和可信度。