摘要
本发明涉及数据分析技术领域,具体涉及一种海量信贷短信的关键信息自动抽取分析方法。该方法通过预设语义标签替换短信文本中的特定信息,并对短信文本进行分词及向量化处理,获得结构化文本表征;根据语义单元内各分词与对应预设语义标签、模板语义锚点,确定语义锚点特征指标;筛选出目标语义锚点;针对各语义分析窗口,根据窗口内目标语义锚点的数量及语义锚点特征指标,确定语义描述强度;根据窗口内目标语义锚点与模板语义锚点的语义差异特性,确定模板相似度;根据语义描述强度与模板相似度,确定窗口的区域注意力权重;将各文本切片的词向量与对应区域注意力权重输入预训练语言模型,输出文本关键信息,由此,提升关键信息准确率。