一种基于增强特征金字塔网络的任意形状场景文本检测方法
实质审查的生效
摘要

本发明公开了一种基于增强特征金字塔网络的任意形状场景文本检测方法,该方法包括如下模块:特征提取模块,用于提取输入图像的特征;比率不变特征增强模块,用于语义信息的增强;重构空间分辨率模块,用于空间信息的增强;特征融合模块,用于将语义信息增强的特征和空间信息增强的特征进行融合,生成多个不同比例的分割结果;渐近扩展模块,作为后处理模块采用渐近扩展算法将特征融合模块生成的多个不同尺度的分割结果进行逐步扩展融合,得到最终的文本检测结果。本发明通过融合增强语义信息的特征和增强空间信息的特征,加深了文本检测模型对输入图像的理解,提高文本的检测精度;后处理模块采用渐近尺度扩展算法对不同尺度的分割图从小到大依次进行扩展,在有效预测场景文本真实形状的同时还能很好的区分开距离较近的文本实例,从而可以实现对任意形状场景文本的检测。

基本信息
专利标题 :
一种基于增强特征金字塔网络的任意形状场景文本检测方法
专利标题(英):
暂无
公开(公告)号 :
CN114387610A
申请号 :
CN202210042376.3
公开(公告)日 :
2022-04-22
申请日 :
2022-01-14
授权号 :
暂无
授权日 :
暂无
发明人 :
谭钦红江一峰黄俊
申请人 :
重庆邮电大学
申请人地址 :
重庆市南岸区崇文路2号
代理机构 :
代理人 :
优先权 :
CN202210042376.3
主分类号 :
G06V30/414
IPC分类号 :
G06V30/414  G06V30/19  G06K9/62  G06F40/30  G06N3/04  G06N3/08  
法律状态
2022-05-10 :
实质审查的生效
IPC(主分类) : G06V 30/414
申请日 : 20220114
2022-04-22 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332