一种基于改进DAN的越南场景文字识别方法
公开
摘要

本发明涉及文字识别领域,具体涉及一种基于改进DAN的越南场景文字识别方法,包括:使用ResNet作为编码器从输入图像中提取原始特征图;将所述原始特征图输入CAM中得到注意力图,具体方式是将原始特征图输入FPN网络得到融合特征图;将融合特征图输入VSFM模块得到视觉与序列融合特征;将所述视觉与序列融合特征输入FCN网络以得到注意力图;将所述原始特征图和所述注意力图以及VSFM中间特征共同输入增强型解码器进行解码,得到场景图的识别结果,该方法有效缓解注意力漂移,将变音符号识别的更准确,并且可以有效区分相似字符,识别结果更好。

基本信息
专利标题 :
一种基于改进DAN的越南场景文字识别方法
专利标题(英):
暂无
公开(公告)号 :
CN114612906A
申请号 :
CN202210206849.9
公开(公告)日 :
2022-06-10
申请日 :
2022-03-04
授权号 :
暂无
授权日 :
暂无
发明人 :
文益民
申请人 :
桂林电子科技大学
申请人地址 :
广西壮族自治区桂林市七星区金鸡路1号
代理机构 :
桂林文必达专利代理事务所(特殊普通合伙)
代理人 :
白洪
优先权 :
CN202210206849.9
主分类号 :
G06V30/148
IPC分类号 :
G06V30/148  G06K9/62  G06V10/764  G06V10/80  G06V30/19  
法律状态
2022-06-10 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332