应用于文本识别的模型训练方法、文本识别方法和装置

公开

摘要

本公开提供了应用于文本识别的模型训练方法、文本识别方法和装置，涉及人工智能，尤其涉及自然语言处理、深度学习和语义分析等领域。具体实现方案为：获取包括无类别标签的文本的第一待训练文本集合和包括预设的第二类别标签的第二待训练文本集合，第二待训练文本集合包括多个文本子集合；基于第一待训练文本集合对初始模型进行训练得到第一模型；重复以下各步骤，i的初始值为1：将第i文本子集合输入至第一模型中得到训练后的第一模型；确定训练后的第一模型为新的第一模型，确定i的取值为i+1；确定达到预设条件时所得到的新的第一模型，为文本识别模型。得到的文本识别模型，可以准确的识别文本是否为预设的类别标签的文本。

基本信息

专利标题：

应用于文本识别的模型训练方法、文本识别方法和装置

专利标题（英）：

暂无

公开（公告）号：

CN114625874A

申请号：

CN202210210047.5

公开（公告）日：

2022-06-14

申请日：

2022-03-03

授权号：

暂无

授权日：

暂无

发明人：

王赞博曹宇慧黄硕陈永锋

申请人：

北京百度网讯科技有限公司

申请人地址：

北京市海淀区上地十街10号百度大厦2层

代理机构：

北京同立钧成知识产权代理有限公司

代理人：

张宁

优先权：

CN202210210047.5

主分类号：

G06F16/35

IPC分类号：

G06F16/35 G06K9/62

IPC结构图谱

G部——物理

G06

计算；推算或计数

G06F

电数字数据处理

G06F16/35

••聚类；分类

法律状态

2022-06-14 ：

公开

注：本法律状态信息仅供参考，即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。

文件下载

暂无PDF文件可下载