一种基于语义增强的曲面场景文本识别方法
公开
摘要

本发明设计了一种基于语义增强的曲面场景文本识别方法,具体流程如图1所示,该方法主要包含了投影变换子网络、编码器、解码器、语义模块和单词嵌入监督模块,本发明可以通过在注意力机制的编解码框架中引入全局语义信息与局部语义信息,将编码器输出的预测全局与局部语义信息输入到解码器,并使用预训练的语言模型的单词嵌入作为监督来提高性能,识别在光照不均匀和字符不完整情况下的曲面场景文本。本发明能够基于现有的曲面场景文本识别算法存在的局限性,分析存在的问题,从而使用户能够更准确的提取曲面目标表面的文本,满足了用户的识别需求,提高了识别的准确率,从而使用户能够享受更便捷的生活。

基本信息
专利标题 :
一种基于语义增强的曲面场景文本识别方法
专利标题(英):
暂无
公开(公告)号 :
CN114612913A
申请号 :
CN202210251062.4
公开(公告)日 :
2022-06-10
申请日 :
2022-03-15
授权号 :
暂无
授权日 :
暂无
发明人 :
谭钦红宋代荣黄俊
申请人 :
重庆邮电大学
申请人地址 :
重庆市南岸区崇文路2号
代理机构 :
代理人 :
优先权 :
CN202210251062.4
主分类号 :
G06V30/40
IPC分类号 :
G06V30/40  G06N3/04  G06N3/08  
法律状态
2022-06-10 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332