一种长文本资料的文本识别方法

实质审查的生效

摘要

本发明公开了一种长文本资料的文本识别方法，包括：获取长文本资料的待检测图像；使用用于检测长文本的场景文字检测模型对所述待检测图像中的文本进行文本框检测，获取多个预测点及各预测点对应的文本框；根据各个所述文本框内的文本行识别所述待检测图像的扭曲状态是否超过预设状态，若是，则对该待检测图像进行扭曲矫正；对扭曲矫正后的待检测图像进行文本识别。解决了长文本图像文本检测效果差的问题，而且实现了对扭曲文本的检测和矫正，很好的适应了复杂场景下图像的文本检测，并保证和提高了文本检测的准确度，为实现准确的文本识别奠定了基础；适应了对用户不专业拍摄生成的图像进行文本检测的场景，提高了用户的使用体验，易于推广应用。

基本信息

专利标题：

一种长文本资料的文本识别方法

专利标题（英）：

暂无

公开（公告）号：

CN114359889A

申请号：

CN202210245889.4

公开（公告）日：

2022-04-15

申请日：

2022-03-14

授权号：

暂无

授权日：

暂无

发明人：

杜博文

申请人：

北京智源人工智能研究院

申请人地址：

北京市海淀区中关村东路1号院8号楼三层B201D-1

代理机构：

北京动力号知识产权代理有限公司

代理人：

梁艳

优先权：

CN202210245889.4

主分类号：

G06V20/62

IPC分类号：

G06V20/62 G06V10/24 G06V30/12 G06N3/04 G06N3/08

法律状态

2022-05-03 ：

实质审查的生效

IPC(主分类) : G06V 20/62
申请日 : 20220314

2022-04-15 ：

公开

注：本法律状态信息仅供参考，即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。

文件下载

暂无PDF文件可下载