摘要
本发明公开了一种风电机组SCADA数据多级协同清洗方法,步骤如下:读取风电场SCADA系统导出的原始数据文件;对数据进行预处理与特征衍生;依次使用LOF算法检测局部密度,使用DBSCAN算法检测空间聚类,利用统计分布检测动态阈值;形成多级协同检测策略;汇总所有检测结果,生成最终的异常标记列;原始数据全集被保留,仅通过该标记列区分异常点与正常点;通过机器学习模型在清洗前后数据集上的性能表现来定量评估清洗效果。本发明融合了LOF、DBSCAN和动态阈值三种不同原理的检测方法,构成了一个多级防御网络,能够有效识别“孤立点”、“集群边缘点”和“统计离群点”等多种异常模式,大大提高了检测的召回率和精确度。