一种不规范药店名称的识别方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种不规范药店名称的识别方法
申请号:CN202411080180
申请日期:2024-08-07
公开号:CN119067119A
公开日期:2024-12-03
类型:发明专利
摘要
本发明涉及药店监管技术领域,具体涉及一种不规范药店名称的识别方法,识别步骤为:在计算机中构建规则库,规则库内包括有药店命名的标准规范;获取不规范药店名称样本集,对样本集进行词频分析,得到样本集中高频率的词汇,将获取的词汇添加在规则库内,完善规则库,分为初步筛选规则与深入筛选规则;基于自然语言处理模型,将待识别的药店名称与初步筛选规则输入模型内。本申请通过对药店名称进行初步识别判断,初步识别能识别筛选出市面上大众的不规范药店名称,而对于一些小众的药店名称基于决策树来进行深入识别,筛选出不规范的药店名称,能够降低人工识别检测的劳动强度,并且提升了识别判断的准确率。
技术关键词
识别方法 样本 信息熵 构建规则库 高频率 数据分布 节点 自然语言 决策树算法 分词 监管技术 计算机 云存储 平方根 定义 大数据 文本