一种通用场景文本检测识别的预处理模型训练方法及系统

公开

摘要

本发明公开了一种通用场景文本检测识别的预处理模型训练方法及系统，属于计算机视觉领域；所述的方法具体步骤如下：S1获取标注好的文本数据集，对图片进行copypaste数据增强操作后送入文本检测网络学习文本区域特征，得到文本检测模型；S2获取文本数据集图片，计算文字区域长边角度θ，根据角度旋转原图片并对旋转后水平区域进行裁剪，将数据划分为0°和180°两类后送入图像分类网络学习图像特征，得到文本方向分类模型；S3获取文本数据集，计算文字区域长边角度θ，根据角度旋转原图片并对旋转后水平区域进行剪裁，对图片进行TIA数据增广，将其数据输入到文字识别网络学习文字特征，得到文字识别模型。

基本信息

专利标题：

一种通用场景文本检测识别的预处理模型训练方法及系统

专利标题（英）：

暂无

公开（公告）号：

CN114581650A

申请号：

CN202210209485.X

公开（公告）日：

2022-06-03

申请日：

2022-03-03

授权号：

暂无

授权日：

暂无

发明人：

马凤强吴运祥李晗刘琛安晓博

申请人：

浪潮云信息技术股份公司

申请人地址：

山东省济南市高新区浪潮路1036号浪潮科技园S01号楼

代理机构：

济南信达专利事务所有限公司

代理人：

姜鹏

优先权：

CN202210209485.X

主分类号：

G06V10/22

IPC分类号：

G06V10/22 G06V10/24 G06V10/774 G06V30/148 G06K9/62

法律状态

2022-06-03 ：

公开

注：本法律状态信息仅供参考，即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。

文件下载

暂无PDF文件可下载