摘要
本申请涉及一种基于机器学习的自动数据安全分级方法,包括:从预设知识库中获取数据元标签和场景标签的文本描述,生成组合文本并通过文本嵌入模型映射为语义向量,构建初始语义向量集合;根据初始语义向量集合结合标注数据,采用回归模型训练生成初步安全评分集合;针对初步安全评分集合计算评分值与整数值的差值,标记模糊条目并构建模糊条目集合;对模糊条目集合进行优先级排序,提取特征数据进行比对分析,生成特征匹配报告;根据所述特征匹配报告调整评分值,构建中间安全评分集合;对中间安全评分集合进行二次比对,保留模糊标记状态,构建最终需复核条目集合;根据最终需复核条目集合生成结构化预测数据报告并存储。