一种未标注数据的半监督命名实体识别的方法
公开
摘要

本发明公开了一种未标注数据的半监督命名实体识别的方法,包括:数据分组、建立识别模型、交叉验证、文本标注、置信度计算和识别训练等步骤,综合多种常用模型的优势,最大程度的降低训练集中噪声数据的干扰,同时本方法并不用训练基于二分类的打分器。目前市面上少量标注文本命名识别算法无法充分挖掘出大量未标注的文本中的信息和降低相应由于少量标注文本带来噪声。该方法还可以通过调整置信度α,来调整最后模型的召回率和精度,在不同场景下使用不同的置信度来满足不同场景下对召回率和精度的不同要求。

基本信息
专利标题 :
一种未标注数据的半监督命名实体识别的方法
专利标题(英):
暂无
公开(公告)号 :
CN114266253A
申请号 :
CN202111573126.4
公开(公告)日 :
2022-04-01
申请日 :
2021-12-21
授权号 :
暂无
授权日 :
暂无
发明人 :
叶文鹏
申请人 :
武汉百智诚远科技有限公司
申请人地址 :
湖北省武汉市东湖新技术开发区关南园一路20号当代科技园(华夏创业中心)高层办公楼7号楼403号(自贸区武汉片区)
代理机构 :
武汉天领众智专利代理事务所(普通合伙)
代理人 :
蕭光佑
优先权 :
CN202111573126.4
主分类号 :
G06F40/295
IPC分类号 :
G06F40/295  G06F16/35  G06K9/62  
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06F
电数字数据处理
G06F40/295
命名实体识别
法律状态
2022-04-01 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332