一种基于知识图谱的药物关系抽取方法
公开
摘要
本发明涉及一种基于知识图谱的药物关系抽取方法,通过PubmedBERT并结合注意力获取药物描述的语义特征,用药物关系抽取数据集和DrugBank数据库构建药物关系知识图谱,通过RotatE模型得到药物的知识嵌入特征;同时获取药物关键路径特征;最后组合药物描述的语义特征、知识嵌入特征和关键路径特征送入多层感知机中分类,同时使用基于知识嵌入的多分类FocalLoss损失函数训练神经网络分类模型,并根据分类模型结果计算分类准确率。通过使用注意力机制获取更符合药物关系抽取任务的语义特征,同时使用知识图谱嵌入,使网络模型具有更好的可解释性,最后通过改进的多分类Focal loss损失函数,有效缓解了数据集分布不均衡问题,使最终分类结果有所提高。
基本信息
专利标题 :
一种基于知识图谱的药物关系抽取方法
专利标题(英):
暂无
公开(公告)号 :
CN114582443A
申请号 :
CN202210166924.3
公开(公告)日 :
2022-06-03
申请日 :
2022-02-23
授权号 :
暂无
授权日 :
暂无
发明人 :
孙霞金鑫陈嘉诚卞婷王明磊
申请人 :
西北大学
申请人地址 :
陕西省西安市太白北路229号
代理机构 :
西安恒泰知识产权代理事务所
代理人 :
李郑建
优先权 :
CN202210166924.3
主分类号 :
G16C20/90
IPC分类号 :
G16C20/90 G16C20/70 G06F16/33 G06F16/35 G06F16/36 G06K9/62 G06N3/04 G06N3/08 G06F40/295 G06F40/30
IPC结构图谱
G
G部——物理
G16
特别适用于特定应用领域的信息通信技术
G16C
计算化学;化学信息学; 计算材料科学
G16C20/90
•编程语言; 计算架构; 数据库系统; 数据仓库
法律状态
2022-06-03 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载