一种医疗命名实体识别方法、装置和电子设备
授权
摘要
本发明公开了一种医疗命名实体识别方法、装置和电子设备。方法包括:利用标注数据集训练得到不同类型的多个命名实体识别NER模型;基于多个所述NER模型,利用主动学习方法从未标注数据中选择待标注数据;利用多个所述NER模型分别对所述待标注数据的类别进行预测;对预测的结果进行融合,得到所述待标注数据的类别。该技术方案实现了使用少量数据达到大量数据相当性能的效果。实际使用数据表明,采用本发明提供的方法,能够在10%的标注数据下,达到全量数据90%左右的性能。因此,本发明的方法很好地满足了医疗场景缺少足够标注信息情况下的信息抽取应用场景的实际需求。
基本信息
专利标题 :
一种医疗命名实体识别方法、装置和电子设备
专利标题(英):
暂无
公开(公告)号 :
CN114169338A
申请号 :
CN202210125810.4
公开(公告)日 :
2022-03-11
申请日 :
2022-02-10
授权号 :
CN114169338B
授权日 :
2022-05-17
发明人 :
安波
申请人 :
北京智源人工智能研究院
申请人地址 :
北京市海淀区中关村东路1号院8号楼三层B201D-1
代理机构 :
北京动力号知识产权代理有限公司
代理人 :
梁艳
优先权 :
CN202210125810.4
主分类号 :
G06F40/295
IPC分类号 :
G06F40/295 G06F40/117 G06F16/35 G06N3/08
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06F
电数字数据处理
G06F40/295
命名实体识别
法律状态
2022-05-17 :
授权
2022-03-29 :
实质审查的生效
IPC(主分类) : G06F 40/295
申请日 : 20220210
申请日 : 20220210
2022-03-11 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载