摘要
本申请公开了一种敏感数据识别方法、装置、电子设备、介质及程序产品,涉及数据安全技术领域,敏感数据识别方法包括:对待识别文本数据进行断句,得到多个短句;统计各短句中不在预设常用词库中的特定词汇,并记录词频在对应的时间驻留矩阵;根据预设的分词规则,对每个短句分别进行分词,确定每个短句对应的多种分词路径;基于各时间驻留矩阵的词频,计算各分词路径分别对应的联合概率,并将联合概率最高的分词路径作为目标分词路径,并对各分词分别进行敏感词检索,得到敏感数据识别结果。本申请的技术方案解决了传统的敏感词匹配算法在处理中文文本时容易发生错误,影响敏感数据识别的准确率的问题。