摘要
本发明涉及一种面向大规模批产的多阶段装配工艺参数在线调控方法,包括如下步骤:将装配工艺参数动态调控策略模型应用于装配系统;通过装配工艺参数动态调控策略模型在装配系统上进行工艺参数的在线修正和优化,获得最优工艺参数;将最优工艺参数应用于装配系统的批产装配过程;其中,所述装配工艺参数动态调控策略模型为将多阶段装配工艺参数动态优化问题建模为马尔可夫决策过程,引入装配过程自适应的经验回放机制,并结合深度强化学习算法建立的装配工艺参数动态调控策略模型。本发明提供的方法结合深度强化学习算法,对装配工艺参数进行动态调控,显著提升了工艺参数调整效率并有效降低了质量合格率波动。