一种基于深度卷积神经网络的文本矫正方法
公开
摘要
本发明公开了一种基于深度卷积神经网络的文本矫正方法,包括以下步骤:步骤1:采集文本的图像数据;步骤2:用经过预处理后的边缘检测神经网络进行训练模型;步骤3:根据步骤2得到的训练好的模型处理原始文本图像,得到边缘图像;步骤4:对边缘图像进行霍夫投票;步骤5:对投票结果进行筛选,以获得合理的4条直线,组成文本轮廓;步骤6:对检测到的四边形轮廓,进行单应性变换,得到最终的矫正文本。原本由于拍摄姿势不正,导致照片中文本发生畸变,比如A4纸张被拍摄成了梯形,经过该文本矫正,可还原为A4纸形状,降低了文本检测的错误率,使算法更加鲁棒。
基本信息
专利标题 :
一种基于深度卷积神经网络的文本矫正方法
专利标题(英):
暂无
公开(公告)号 :
CN114612920A
申请号 :
CN202210306080.8
公开(公告)日 :
2022-06-10
申请日 :
2022-03-25
授权号 :
暂无
授权日 :
暂无
发明人 :
郭延文孟祥祥
申请人 :
南京大学
申请人地址 :
江苏省南京市栖霞区仙林大道163号
代理机构 :
深圳峰诚志合知识产权代理有限公司
代理人 :
杜翠鸣
优先权 :
CN202210306080.8
主分类号 :
G06V30/412
IPC分类号 :
G06V30/412 G06K9/62 G06N3/04 G06N3/08 G06V10/774 G06V10/82
法律状态
2022-06-10 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载