一种中文电子病历后结构化信息的抽取方法
实质审查的生效
摘要

本发明公开了一种中文电子病历后结构化信息的抽取方法,首先使用BERT模型对含有不同症状实体修饰成分的句子进行分类,然后利用现有的命名实体识别模型对每类句子中的症状实体做不同类别的标注,达到识别实体修饰成分的目的。提出基于规则的中文电子病历中症状实体属性值的特征化抽取方法。通过总结病历文本症状语义段的行文规则,形成属性值的抽取模板,将抽取到属性值存储到数据库中。本发明基于现有的病历文本抽取技术成果,深入分析病历文本的行文规则,对已经完成分词和标注的症状语义段进行实体修饰识别和特征化的属性值抽取,能为后续的上层应用提供结构化的数据支持。

基本信息
专利标题 :
一种中文电子病历后结构化信息的抽取方法
专利标题(英):
暂无
公开(公告)号 :
CN114420233A
申请号 :
CN202210052810.6
公开(公告)日 :
2022-04-29
申请日 :
2022-01-18
授权号 :
暂无
授权日 :
暂无
发明人 :
蒋雪晴杜金莲高红雨张潇张津丽
申请人 :
北京工业大学
申请人地址 :
北京市朝阳区平乐园100号
代理机构 :
北京思海天达知识产权代理有限公司
代理人 :
沈波
优先权 :
CN202210052810.6
主分类号 :
G16H10/60
IPC分类号 :
G16H10/60  G16H50/70  G06F16/35  G06F16/28  G06F40/295  G06F40/186  G06N3/04  G06N3/08  
IPC结构图谱
G
G部——物理
G16
特别适用于特定应用领域的信息通信技术
G16H
医疗保健信息学,即专门用于处置或处理医疗或健康数据的信息和通信技术
G16H10/00
专门用于加工或处理患者相关医疗或保健数据的ICT
G16H10/60
患者特定数据,例如电子病历记录
法律状态
2022-05-20 :
实质审查的生效
IPC(主分类) : G16H 10/60
申请日 : 20220118
2022-04-29 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332