一种微任务语料数据清洗方法
公开
摘要

本发明公开了一种微任务语料数据清洗方法,具体包括以下步骤:S1、对需要清洗的语料数据预先埋入已知结果的语料数据形成语料埋点数据后开始清洗;S2、配置语料数据的清洗参数;S3、清洗语料分类任务;S4、计算语料分类任务的分类结果:1)获取分类结果可确认的语料;2)计算一级译者处理语料分类任务的可信度;3)确认语料分类任务的分类结果;4)审核语料的分类结果S5、清洗语料编辑任务;S6、质检编辑后的语料。本发明包含语料分类任务和语料编辑任务的清洗,借助不同等级的译者清洗不同的任务,针对性强,提高清洗效率,同时借助系统算法对清洗任务进行自动审核和确认,能够减轻清洗工作量,节省清洗成本。

基本信息
专利标题 :
一种微任务语料数据清洗方法
专利标题(英):
暂无
公开(公告)号 :
CN114564972A
申请号 :
CN202210206766.X
公开(公告)日 :
2022-05-31
申请日 :
2022-03-03
授权号 :
暂无
授权日 :
暂无
发明人 :
张甫朝
申请人 :
语联网(武汉)信息技术有限公司
申请人地址 :
湖北省武汉市武汉东湖新技术开发区高新大道999号未来科技城B2栋
代理机构 :
北京中北知识产权代理有限公司
代理人 :
李新昂
优先权 :
CN202210206766.X
主分类号 :
G06F40/58
IPC分类号 :
G06F40/58  G06F16/215  G06K9/62  
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06F
电数字数据处理
G06F40/58
使用机器翻译,例如用于多语言检索,用于客户端设备的服务器端翻译或实时翻译。
法律状态
2022-05-31 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332