摘要
本发明涉及一种数据安全评估领域,公开了一种油气勘探开发敏感数据自动化分类分级方法及系统,其包括:对存储在数据湖中的多源异构数据进行数据特征工程处理,提取名称特征、业务范围、数据特征和初始安全分级信息,构建数据特征向量;基于已标注的数据样本,计算数据特征向量的特征相似度,构建数据项间的关系网络,进行标签传播及安全等级评估,将已知安全等级信息传递至未标注数据项,实现自动分级;采用规则模型混合机制,通过标签扩散模型评估、输出数据安全等级分类结果与用户反馈迭代优化安全分级结果,应用反馈数据进行标签扩散模型再训练,得到分类结果。本发明能从数据关联关系出发,通过标签传播算法实现多类型数据的安全等级自动评估。