一种融合空洞卷积的快速场景文本检测方法
实质审查的生效
摘要
本发明公开了一种融合空洞卷积的快速场景文本检测方法,包括获取文本检测训练数据集,并对训练数据集进行标签生成;建立融合空洞卷积的快速场景文本检测初步模型;所述融合空洞卷积的快速场景文本检测初步模型包括轻量级特征提取模块、空洞卷积模块和可微分二值化模块;使用标签生成的训练数据集对建立的融合空洞卷积的快速场景文本检测初步模型,并使用损失函数计算损失值以调整所述初步模型的参数得到融合空洞卷积的快速场景文本检测模型;采用融合空洞卷积的快速场景文本检测模型对场景中文本进行检测。本发明利用轻量级的神经网络替换大型网络用于提取输入图形的特征,降低的网络模型参数量,可以有效的提高文本检测网络模型的效率。同时为了弥补轻量级神经网络提取特征不足的问题,在特征融合层增加空洞卷积模块并使用通道注意力机制对特征进行融合筛选,提高了网络中特征的利用效率。因此本发明在保持较高文本检测水平的情况下,实现场景文本的快速检测。
基本信息
专利标题 :
一种融合空洞卷积的快速场景文本检测方法
专利标题(英):
暂无
公开(公告)号 :
CN114529894A
申请号 :
CN202210046573.2
公开(公告)日 :
2022-05-24
申请日 :
2022-01-14
授权号 :
暂无
授权日 :
暂无
发明人 :
谭钦红江一峰黄俊
申请人 :
重庆邮电大学
申请人地址 :
重庆市南岸区崇文路2号
代理机构 :
代理人 :
优先权 :
CN202210046573.2
主分类号 :
G06V20/62
IPC分类号 :
G06V20/62 G06N3/04 G06K9/62 G06V10/82 G06V10/774 G06V10/80
法律状态
2022-06-10 :
实质审查的生效
IPC(主分类) : G06V 20/62
申请日 : 20220114
申请日 : 20220114
2022-05-24 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载