文本识别方法、设备及存储介质

申请号：CN202511358437

申请日期：2025-09-23

公开号：CN120853151B

公开日期：2025-12-23

类型：发明专利

摘要

本申请公开了一种文本识别方法、设备及存储介质，该文本识别方法包括：对待识别图像进行图像特征提取，得到图像特征向量；计算图像特征向量中各个特征属于文本区域的概率，基于图像特征向量中各个特征属于文本区域的概率确定文本关注区域；对文本关注区域进行位置编码得到查询向量，提取文本关注区域对应的图像特征得到窗口特征向量；基于查询向量和窗口特征向量解码文本类别和文本位置，得到待识别图像中待识别文本的文本识别结果。将需要关注的区域位置信息与需要关注区域的图像信息整合到一起传入解码器，可以减少查询向量与无关背景信息之间地交互，降低图像中其他无关区域特征对文本解码的干扰，提高最终输出的文本识别结果的准确性。

技术关键词

图像特征向量文本识别方法文本识别模型注意力图像特征提取解码器编码器区域位置信息标签可读存储介质多层感知机坐标电子设备转化器处理器