基于医学词典的实体提取方法、装置、设备及存储介质
授权
摘要

本发明公开了一种基于医学词典的实体提取方法,属于自然语言处理领域。该方法包括:基于原始医学词典构建前缀词典和后缀词典;对中文病历做n‑gram遍历;将遍历后得到各个词组分别与原始医学词典、前缀词典和后缀词典进行匹配并输出匹配结果;根据匹配结果与特征向量的对应规则,输出每个字的特征向量;将输出的每个字的特征向量对应拼接每个字的初始向量之后,以得到用于表征中文病历的向量集;将用于表征所述中文病历的向量集输入训练好的模型以抽取其中的实体。本发明通过先识别出中文病历中的实体转换成特征向量,然后将中文病历整体转换成的向量集作为模型的输入,以提高模型对实体抽取的准确率。

基本信息
专利标题 :
基于医学词典的实体提取方法、装置、设备及存储介质
专利标题(英):
暂无
公开(公告)号 :
CN110162782A
申请号 :
CN201910308003.4
公开(公告)日 :
2019-08-23
申请日 :
2019-04-17
授权号 :
CN110162782B
授权日 :
2022-04-01
发明人 :
丁佳佳李春宇倪渊谢国彤
申请人 :
平安科技(深圳)有限公司
申请人地址 :
广东省深圳市福田区福田街道福安社区益田路5033号平安金融中心23楼
代理机构 :
北京英特普罗知识产权代理有限公司
代理人 :
林彦之
优先权 :
CN201910308003.4
主分类号 :
G06F17/27
IPC分类号 :
G06F17/27  G06F16/33  G16H10/60  
法律状态
2022-04-01 :
授权
2021-03-02 :
实质审查的生效
IPC(主分类) : G06F 17/27
申请日 : 20190417
2019-08-23 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332