基于连续时间近端策略优化强化学习算法的卫星轨道控制方法

申请号：CN202511243345

申请日期：2025-09-02

公开号：CN120722768B

公开日期：2025-10-31

类型：发明专利

摘要

本发明公开了一种基于连续时间近端策略优化强化学习算法的卫星轨道控制方法，包括以下步骤：步骤1、基于连续时间近端策略优化强化学习算法，确定卫星采取的动作即加速度，以及动作的执行时间；步骤2、基于步骤1得到的卫星采取的动作以及执行的时间，实现对卫星轨道控制。本发明通过结合先进的近端策略优化强化学习算法（PPO）与连续时间控制框架，提供了一种高精度、稳定且能效优化的卫星轨道控制解决方案，具有显著的技术先进性和广泛的应用前景，为未来的空间探索和卫星运营提供了强有力的技术支持。

技术关键词

卫星轨道控制方法强化学习算法加速度状态更新估计方法深度神经网络训练 ReLU函数方程参数广义策略更新偏差框架比率轨迹因子数据