一种适用于不平衡小样本电力敏感数据的识别方法及系统
申请号:CN202510798132
申请日期:2025-06-16
公开号:CN120705470A
公开日期:2025-09-26
类型:发明专利
摘要
本发明涉及自然语言处理技术领域,特别涉及一种适用于不平衡小样本电力敏感数据的识别方法及系统。本发明对电力负面清单数据从两个维度对数据进行标注,即根据数据的敏感程度将数据标记为敏感或者不敏感,之后,再根据各类样本的数量将其标记为“少类别”或“多类别”,以此来引入标签间的关联信息。数据标注完成之后,使用双分支网络BERT‑Att‑KAN进行训练学习,其中BERT‑Att‑KAN的一个分支用于识别数据的敏感性,另一个分支用于判断数据的样本分布类别。本发明提升了电力负面清单数据的识别准确度。
技术关键词
Attention机制
识别方法
语义向量
电力
数据
样本
双标签
BERT模型
字词
注意力
训练集
文本
可读存储介质
双分支网络
标记
优化器