文本识别模型的训练方法、文本识别方法、装置和设备

公开

摘要

本申请公开了一种文本识别模型的训练方法、文本识别方法、装置和设备，属于计算机技术领域。方法包括：获取样本文本图像和样本文本图像的标注结果；基于第一网络模型获取样本文本图像的视觉特征，样本文本图像的视觉特征用于表征样本文本图像中各个字符的外形和位置；基于第一网络模型和样本文本图像的视觉特征，获取样本文本图像的第一预测结果；基于第二网络模型和样本文本图像的视觉特征，获取样本文本图像的第二预测结果；基于第一预测结果、第二预测结果和标注结果，对第一网络模型进行调整，得到文本识别模型。该文本识别模型综合了不同模型的文本识别能力，提高了文本识别模型对视觉特征的提取能力，提高了文本识别模型的文本识别能力。

基本信息

专利标题：

文本识别模型的训练方法、文本识别方法、装置和设备

专利标题（英）：

暂无

公开（公告）号：

CN114462580A

申请号：

CN202210126459.0

公开（公告）日：

2022-05-10

申请日：

2022-02-10

授权号：

暂无

授权日：

暂无

发明人：

张慧黄珊

申请人：

腾讯科技（深圳）有限公司

申请人地址：

广东省深圳市南山区高新区科技中一路腾讯大厦35层

代理机构：

北京三高永信知识产权代理有限责任公司

代理人：

李文静

优先权：

CN202210126459.0

主分类号：

G06N3/04

IPC分类号：

G06N3/04 G06N3/08 G06V20/62 G06V10/22 G06V10/40 G06V10/80 G06V10/82 G06K9/62

IPC结构图谱

G部——物理

G06

计算；推算或计数

G06N

基于特定计算模型的计算机系统

G06N3/00

基于生物学模型的计算机系统

G06N3/02

采用神经网络模型

G06N3/04

体系结构，例如，互连拓扑

法律状态

2022-05-10 ：

公开

注：本法律状态信息仅供参考，即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。

文件下载

暂无PDF文件可下载