基于连续时间近端策略优化强化学习算法的卫星轨道控制方法
申请号:CN202511243345
申请日期:2025-09-02
公开号:CN120722768B
公开日期:2025-10-31
类型:发明专利
摘要
本发明公开了一种基于连续时间近端策略优化强化学习算法的卫星轨道控制方法,包括以下步骤:步骤1、基于连续时间近端策略优化强化学习算法,确定卫星采取的动作即加速度,以及动作的执行时间;步骤2、基于步骤1得到的卫星采取的动作以及执行的时间,实现对卫星轨道控制。本发明通过结合先进的近端策略优化强化学习算法(PPO)与连续时间控制框架,提供了一种高精度、稳定且能效优化的卫星轨道控制解决方案,具有显著的技术先进性和广泛的应用前景,为未来的空间探索和卫星运营提供了强有力的技术支持。
技术关键词
卫星轨道控制方法
强化学习算法
加速度
状态更新
估计方法
深度神经网络训练
ReLU函数
方程
参数
广义
策略更新
偏差
框架
比率
轨迹
因子
数据