一种基于特征融合和注意力增强的自然场景文本检测方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于特征融合和注意力增强的自然场景文本检测方法
申请号:CN202511423595
申请日期:2025-09-30
公开号:CN121033869A
公开日期:2025-11-28
类型:发明专利
摘要
本发明公开了一种基于特征融合和注意力增强的自然场景文本检测方法,包括以下步骤:获取待检测图像;构建自然场景下的文本检测模型,用于对图像中的文本信息进行提取;对所述自然场景下的文本检测模型进行训练,得到训练好的自然场景下的文本检测模型;将待检测图像输入到训练好的自然场景下的文本检测模型中,实现对图像中包含的文本信息进行提取。通过注意力增强模块,使得模型对文本实例信息更加敏感,增强对不规则文本实例的检测;最终实现对自然场景文本检测性能的提升。通过主观观感和准确率和召回率等各项指标在主流数据集上的表现结果,表明该发明在自然场景文本检测方面有重要的意义。
技术关键词
自然场景文本检测 文本检测模型 代表 通道 前馈神经网络 多尺度特征 图像 编码器 注意力机制 背景噪声 尺寸 模块 矩阵 分支 解码器 字符