一种基于机器学习的自动数据安全分级方法

申请号：CN202511167962

申请日期：2025-08-20

公开号：CN120670590B

公开日期：2025-11-07

类型：发明专利

摘要

本申请涉及一种基于机器学习的自动数据安全分级方法，包括：从预设知识库中获取数据元标签和场景标签的文本描述，生成组合文本并通过文本嵌入模型映射为语义向量，构建初始语义向量集合；根据初始语义向量集合结合标注数据，采用回归模型训练生成初步安全评分集合；针对初步安全评分集合计算评分值与整数值的差值，标记模糊条目并构建模糊条目集合；对模糊条目集合进行优先级排序，提取特征数据进行比对分析，生成特征匹配报告；根据所述特征匹配报告调整评分值，构建中间安全评分集合；对中间安全评分集合进行二次比对，保留模糊标记状态，构建最终需复核条目集合；根据最终需复核条目集合生成结构化预测数据报告并存储。

技术关键词

语义向量数据安全条目梯度提升机模糊阈值报告支持向量机算法 SVM分类器标签算法校验线性插值法中文文本误差控制生成特征标记场景滑动窗口偏差