敏感数据识别方法、装置、电子设备、介质及程序产品

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
敏感数据识别方法、装置、电子设备、介质及程序产品
申请号:CN202411596271
申请日期:2024-11-08
公开号:CN119557916A
公开日期:2025-03-04
类型:发明专利
摘要
本申请公开了一种敏感数据识别方法、装置、电子设备、介质及程序产品,涉及数据安全技术领域,敏感数据识别方法包括:对待识别文本数据进行断句,得到多个短句;统计各短句中不在预设常用词库中的特定词汇,并记录词频在对应的时间驻留矩阵;根据预设的分词规则,对每个短句分别进行分词,确定每个短句对应的多种分词路径;基于各时间驻留矩阵的词频,计算各分词路径分别对应的联合概率,并将联合概率最高的分词路径作为目标分词路径,并对各分词分别进行敏感词检索,得到敏感数据识别结果。本申请的技术方案解决了传统的敏感词匹配算法在处理中文文本时容易发生错误,影响敏感数据识别的准确率的问题。
技术关键词
敏感数据识别方法 分词 马尔可夫模型 矩阵 计算机程序产品 数据安全技术 电子设备 中文文本 处理器 指数 模块 可读存储介质 频率 存储器 专业