文本分类语料标注训练系统
授权
摘要

本发明公开的一种文本分类语料标注训练系统,旨在提供一种能够降低人工标注反复度,并能提升预标注结果准确性的半自动化标注训练装置。本发明通过下述技术方案予以实现:文本分类语料标注准备模块统计文本词频,去除文本的噪声信息;半自动化文本分类标注模块在分类标注任务中选择CNN、KNN、ANN、深度学习算法,把非结构化和半结构化的文本转换为向量空间模型,生成文本的词向量空间,抽取反映文档主题特征;当标注任务完成后,反馈式模型学习训练模块反馈分类标注模型完善更新;文本分类标注模型效果评估模块基于分类指标规则对评测指标进行量化,建立标注算法综合评估模型,分析测试结果,评价分类结果,对模型指标量化标注效果进行评估。

基本信息
专利标题 :
文本分类语料标注训练系统
专利标题(英):
暂无
公开(公告)号 :
CN110298032A
申请号 :
CN201910455049.9
公开(公告)日 :
2019-10-01
申请日 :
2019-05-29
授权号 :
CN110298032B
授权日 :
2022-06-14
发明人 :
崔莹代翔王侃丁洪丽杨露陈涛余博王日冬
申请人 :
西南电子技术研究所(中国电子科技集团公司第十研究所)
申请人地址 :
四川省成都市金牛区茶店子东街48号
代理机构 :
成飞(集团)公司专利中心
代理人 :
郭纯武
优先权 :
CN201910455049.9
主分类号 :
G06F17/27
IPC分类号 :
G06F17/27  G06K9/62  
相关图片
法律状态
2022-06-14 :
授权
2019-11-01 :
实质审查的生效
IPC(主分类) : G06F 17/27
申请日 : 20190529
2019-10-01 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
1、
CN110298032A.PDF
PDF下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332