作弊文本识别模型的训练方法、装置、设备和存储介质

实质审查的生效

摘要

本申请公开了一种作弊文本识别模型的训练方法、装置、设备和存储介质，涉及计算机技术领域，具体涉及自然语言处理技术及深度学习等人工智能领域。具体实现方案为：获取新增语料；从新增语料中获取第一训练语料；根据历史语料与第一训练语料，生成第二训练语料；从作弊文本识别模型的历史版本中确定目标版本模型；根据第二训练语料，基于增量学习对目标版本模型进行增量训练，并将经过增量训练后得到的模型作为最新版本的作弊文本识别模型。本申请无需再完全重新训练模型，减少了模型开发时间，也使得模型可以及时应对快速变化的线上作弊内容，以及提高作弊文本识别模型的准确度。

基本信息

专利标题：

作弊文本识别模型的训练方法、装置、设备和存储介质

专利标题（英）：

暂无

公开（公告）号：

CN114372514A

申请号：

CN202111564589.4

公开（公告）日：

2022-04-19

申请日：

2021-12-20

授权号：

暂无

授权日：

暂无

发明人：

李迪马晶义宋丹丹

申请人：

北京百度网讯科技有限公司

申请人地址：

北京市海淀区上地十街10号百度大厦二层

代理机构：

北京清亦华知识产权代理事务所(普通合伙)

代理人：

杜月

优先权：

CN202111564589.4

主分类号：

G06K9/62

IPC分类号：

G06K9/62 G06F16/35

IPC结构图谱

G部——物理

G06

计算；推算或计数

G06K

数据识别；数据表示；记录载体；记录载体的处理

G06K9/00

用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置

G06K9/62

应用电子设备进行识别的方法或装置

法律状态

2022-05-06 ：

实质审查的生效

IPC(主分类) : G06K 9/62
申请日 : 20211220

2022-04-19 ：

公开

注：本法律状态信息仅供参考，即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。

文件下载

暂无PDF文件可下载