文本识别模型的训练方法、文本识别方法及相关装置
公开
摘要

本公开涉及一种文本识别模型的训练方法、文本识别方法及相关装置,以解决话题业务场景下训练样本不足的问题,并通过预训练模型加快训练速度。该训练方法包括:获取目标文本,目标文本包括第一文本、第一掩码文本和第二文本;将第一文本、第一掩码文本和第二文本输入文本识别模型,得到文本识别模型输出的用于表征第一文本与第二文本是否属于同一话题类型的话题预测结果、第一文本对应的第一文本向量、第二文本对应的第二文本向量和第一掩码文本对应的第一掩码向量;根据第一文本向量、第一掩码向量、第二文本向量、话题标签和话题预测结果确定目标损失函数值,并基于目标损失函数值调整所述文本识别模型的参数。

基本信息
专利标题 :
文本识别模型的训练方法、文本识别方法及相关装置
专利标题(英):
暂无
公开(公告)号 :
CN114626551A
申请号 :
CN202210283937.9
公开(公告)日 :
2022-06-14
申请日 :
2022-03-21
授权号 :
暂无
授权日 :
暂无
发明人 :
陈维识
申请人 :
北京字节跳动网络技术有限公司
申请人地址 :
北京市石景山区实兴大街30号院3号楼2层B-0035房间
代理机构 :
北京英创嘉友知识产权代理事务所(普通合伙)
代理人 :
温易娜
优先权 :
CN202210283937.9
主分类号 :
G06N20/00
IPC分类号 :
G06N20/00  G06V10/70  G06V30/41  
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06N
基于特定计算模型的计算机系统
G06N20/00
机器学习
法律状态
2022-06-14 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332