基于病历的医学实体和关系联合提取方法和装置
公开
摘要

本发明提供一种基于病历的医学实体和关系联合提取方法和装置,其中方法包括:对病历文本进行语义分割,得到多个待识别文本;对多个待识别文本中的分词分别进行序列组合,得到多个待识别文本的待识别词序列;待识别词序列由对应待识别文本中的一个分词或多个连续分词组合而成;利用实体关系联合抽取模型,对任一待识别文本的待识别词序列进行医学实体识别,得到多个医学实体以及多个医学实体的实体类型,并在确定待识别文本的两个医学实体中的头实体和尾实体后,基于头实体和尾实体的实体表示、最近尾实体距离和尾实体间隔,确定两个医学实体之间是否存在待确认实体关系。本发明提高了医学关系抽取的准确性、嵌套实体识别的全面性和模型效率。

基本信息
专利标题 :
基于病历的医学实体和关系联合提取方法和装置
专利标题(英):
暂无
公开(公告)号 :
CN114596931A
申请号 :
CN202210500531.1
公开(公告)日 :
2022-06-07
申请日 :
2022-05-10
授权号 :
暂无
授权日 :
暂无
发明人 :
秦晓宏华宗楠
申请人 :
上海柯林布瑞信息技术有限公司
申请人地址 :
上海市徐汇区宜山路700号B2栋1504室
代理机构 :
北京超凡宏宇专利代理事务所(特殊普通合伙)
代理人 :
何明伦
优先权 :
CN202210500531.1
主分类号 :
G16H10/60
IPC分类号 :
G16H10/60  G16H50/70  G06F16/35  G06F40/242  G06F40/295  G06F40/30  
IPC结构图谱
G
G部——物理
G16
特别适用于特定应用领域的信息通信技术
G16H
医疗保健信息学,即专门用于处置或处理医疗或健康数据的信息和通信技术
G16H10/00
专门用于加工或处理患者相关医疗或保健数据的ICT
G16H10/60
患者特定数据,例如电子病历记录
法律状态
2022-06-07 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332