摘要
本发明公开了一种内窥镜手术的动作识别方法、系统及存储介质,应用于医学图像识别领域。提取内窥镜手术视频图像的不同层次的特征图,将低级视觉特征、高级语义特征与手术动作组元特征融合,采用基于组元特征空间的互信息蒸馏以保留的不同组元特征并除去冗余信息;进行非目标信息蒸馏以消除头部类一致性偏差,得到无头部偏差特征;利用时间维度丰富特征,并减小相近帧对当前帧的影响,获得与手术动作组元特征对齐的有效时间特征,得到时空融合特征;采用对比学习方法构建正负样本以及基于动量的样本更新策略对尾部特征增强;对无头部偏差特征、时空融合特征以及尾部增强特征进行组合,得到手术动作识别结果。本发明保证了手术动作识别的精确度。