摘要
本申请提供药物组合优化控制的仿真方法、装置、电子设备及介质,其中方法包括:构建基于主体的多尺度模型;基于目标药物组合的多个预设投药策略、基于主体的多尺度模型以及预设微分方程模型训练物理信息神经网络模型,并将训练好的物理信息神经网络模型确定为基于主体的多尺度模型的代理模型;使用代理模型作为强化学习的环境,对药物组合的投药策略进行强化学习,得到训练好的强化学习模型;将目标药物组合的初始投药情况和初始肿瘤密度输入训练好的强化学习模型,得到优化后的目标药物组合的投药策略。这样,通过基于主体的多尺度模型训练的代理模型进行强化学习,可以准确且高效地对强化学习的环境进行仿真,提高了药物组合优化控制的准确度。