基于多尺度特征融合的网络图像文本识别方法及系统
实质审查的生效
摘要

本发明公开了一种基于多尺度特征融合的网络图像文本识别方法及系统,所述方法包括:通过残差网络的U‑net网络结构,提取出训练数据集中每张网络原始图片所有文本信息的特征图;基于残差网络提取的全部文本信息的特征图,利用全卷积网络输出文本预测框和文本预测框水平角度;将残差网络提取的全部文本信息的特征图结合文本预测框水平角度,对特征图有向特征区域进行仿射变换的旋转操作,得到轴向对齐的特征图;对轴向对齐的特征图进行文本标签转录,并配合全卷积网络输出的文本检测结果,输出原始图片所有文本的检测和识别结果。本发明能同时完成网络图像文本的检测和识别,只使用少量额外训练数据即可提高网络图像文本识别的精确率。

基本信息
专利标题 :
基于多尺度特征融合的网络图像文本识别方法及系统
专利标题(英):
暂无
公开(公告)号 :
CN114359906A
申请号 :
CN202111506810.0
公开(公告)日 :
2022-04-15
申请日 :
2021-12-10
授权号 :
暂无
授权日 :
暂无
发明人 :
王晓帅祥王薇袁鑫涂兴月徐新
申请人 :
武汉科技大学
申请人地址 :
湖北省武汉市青山区和平大道947号
代理机构 :
杭州宇信知识产权代理事务所(普通合伙)
代理人 :
张宇娟
优先权 :
CN202111506810.0
主分类号 :
G06V30/146
IPC分类号 :
G06V30/146  G06V10/80  G06V10/82  G06K9/62  G06N3/04  G06N3/08  
法律状态
2022-05-03 :
实质审查的生效
IPC(主分类) : G06V 30/146
申请日 : 20211210
2022-04-15 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332