一种联合序列标注和模式匹配的事件元素检测方法
授权
摘要
目前的中文医疗事理知识图谱事件元素检测研究主要基于单一的模式匹配或深度学习模型,且未对事件元素进行长短级粒度划分,不能有效抽取长句级元素,导致了模型灵活性不高、泛化性差。因此,本发明提出了一种联合序列标注和模式匹配的事件元素检测方法,创新点在依据事件类型对其中的事件元素进行粒度区分,并针对不同粒度的事件元素采用不同的方法进行检测。首先,对于短词级事件元素检测,使用基于序列标注的BERT‑BiLSTM‑CRF模型,并结合实体信息、触发词信息等语料特征,以实现较强的可扩展性。其次,通过联合依存句法分析的模式匹配方法,进行了长句级事件元素的检测,由此提高事件元素检测的准确率。
基本信息
专利标题 :
一种联合序列标注和模式匹配的事件元素检测方法
专利标题(英):
暂无
公开(公告)号 :
CN113177416A
申请号 :
CN202110532819.2
公开(公告)日 :
2021-07-27
申请日 :
2021-05-17
授权号 :
CN113177416B
授权日 :
2022-06-07
发明人 :
翟鹏珺王晨方钰徐蔚
申请人 :
同济大学
申请人地址 :
上海市杨浦区四平路1239号
代理机构 :
上海科律专利代理事务所(特殊普通合伙)
代理人 :
叶凤
优先权 :
CN202110532819.2
主分类号 :
G06F40/30
IPC分类号 :
G06F40/30 G06F40/211 G06F40/186 G06N3/04
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06F
电数字数据处理
G06F40/30
语义分析
法律状态
2022-06-07 :
授权
2021-08-13 :
实质审查的生效
IPC(主分类) : G06F 40/30
申请日 : 20210517
申请日 : 20210517
2021-07-27 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载