一种语料生成、模型训练方法
授权
摘要

本发明实施例提供了一种语料生成、模型训练方法,涉及人工智能技术领域,上述方法包括:获得属于每一目标语料类别的已有样本语料的已有数量,针对每一目标语料类别,以基线样本数量为基准,根据属于该目标语料类别的已有样本语料中包含的词槽对已有样本语料进行调整,生成新样本语料,使得所生成的新样本语料的数量与该目标语料类别对应的已有样本语料的数量之和达到基线样本数量。应用本发明实施例提供的方案生成语料,可以使得属于各个目标语料类别的已有样本语料与新样本语料的数量之和均衡。进而使得训练得到的分类模型对语料进行分类的准确度在不同语料类别间的差异较小。

基本信息
专利标题 :
一种语料生成、模型训练方法
专利标题(英):
暂无
公开(公告)号 :
CN111831823A
申请号 :
CN202010664773.5
公开(公告)日 :
2020-10-27
申请日 :
2020-07-10
授权号 :
CN111831823B
授权日 :
2022-05-13
发明人 :
李林峰黄海荣孔晓泉董泽朝宋寒风
申请人 :
湖北亿咖通科技有限公司
申请人地址 :
湖北省武汉市经济技术开发区神龙大道18号太子湖文化数字产业园创谷启动区C101号
代理机构 :
北京柏杉松知识产权代理事务所(普通合伙)
代理人 :
孟维娜
优先权 :
CN202010664773.5
主分类号 :
G06F16/35
IPC分类号 :
G06F16/35  G10L15/06  G10L15/16  G10L15/18  G10L15/22  G10L25/30  G10L25/63  
相关图片
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06F
电数字数据处理
G06F16/35
••聚类;分类
法律状态
2022-05-13 :
授权
2022-04-19 :
专利申请权、专利权的转移
专利申请权的转移IPC(主分类) : G06F 16/35
登记生效日 : 20220407
变更事项 : 申请人
变更前权利人 : 湖北亿咖通科技有限公司
变更后权利人 : 亿咖通(湖北)技术有限公司
变更事项 : 地址
变更前权利人 : 430056 湖北省武汉市经济技术开发区神龙大道18号太子湖文化数字产业园创谷启动区C101号
变更后权利人 : 430051 湖北省武汉市经济技术开发区神龙大道18号太子湖文化数字创意产业园创谷启动区B1336号
2020-11-13 :
实质审查的生效
IPC(主分类) : G06F 16/35
申请日 : 20200710
2020-10-27 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
1、
CN111831823A.PDF
PDF下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332