文本识别方法、设备及存储介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
文本识别方法、设备及存储介质
申请号:CN202511358437
申请日期:2025-09-23
公开号:CN120853151B
公开日期:2025-12-23
类型:发明专利
摘要
本申请公开了一种文本识别方法、设备及存储介质,该文本识别方法包括:对待识别图像进行图像特征提取,得到图像特征向量;计算图像特征向量中各个特征属于文本区域的概率,基于图像特征向量中各个特征属于文本区域的概率确定文本关注区域;对文本关注区域进行位置编码得到查询向量,提取文本关注区域对应的图像特征得到窗口特征向量;基于查询向量和窗口特征向量解码文本类别和文本位置,得到待识别图像中待识别文本的文本识别结果。将需要关注的区域位置信息与需要关注区域的图像信息整合到一起传入解码器,可以减少查询向量与无关背景信息之间地交互,降低图像中其他无关区域特征对文本解码的干扰,提高最终输出的文本识别结果的准确性。
技术关键词
图像特征向量 文本识别方法 文本识别模型 注意力 图像特征提取 解码器 编码器 区域位置信息 标签 可读存储介质 多层感知机 坐标 电子设备 转化器 处理器