基于高斯增强及辅助任务的蛋白质相互作用关系抽取方法
实质审查的生效
摘要

本发明公开了基于高斯增强及辅助任务的蛋白质相互作用关系抽取方法,涉及自然语言处理的技术领域。本发明使用生物医学领域预训练模型BioBERT生成文本文档的高质量上下文表示,从而对单词进行更加近乎实际语义的词向量表示,解决了生物医学文本中单词的一词多义问题;在BioBERT的基础上使用高斯概率分布可以提高目标蛋白质实体及其邻近词的权重,得到目标实体的增强表示,使模型学习到了实例的局部结构。使用文档分类作为辅助任务改善了从模型中获得的文档的表示,并隐含的增加了数据信息。本发明解决了目前蛋白质相互作用关系抽取中存在的输入文本长,目标蛋白质实体在数据集中分布散乱的问题,提高了该任务上性能的精度。

基本信息
专利标题 :
基于高斯增强及辅助任务的蛋白质相互作用关系抽取方法
专利标题(英):
暂无
公开(公告)号 :
CN114373512A
申请号 :
CN202111627067.4
公开(公告)日 :
2022-04-19
申请日 :
2021-12-28
授权号 :
暂无
授权日 :
暂无
发明人 :
张益嘉刘达杨名陈飞
申请人 :
大连海事大学
申请人地址 :
辽宁省大连市高新园区凌海路1号
代理机构 :
大连东方专利代理有限责任公司
代理人 :
陈丽
优先权 :
CN202111627067.4
主分类号 :
G16B50/30
IPC分类号 :
G16B50/30  G06F16/35  G06F16/36  G06F40/247  G06F40/289  G06F40/295  
IPC结构图谱
G
G部——物理
G16
特别适用于特定应用领域的信息通信技术
G16B
生物信息学,例如特别适用于计算分子生物学中的遗传或蛋白质相关数据处理的信息与通信技术
G16B50/00
特别适用于生物信息学的ICT程序设计工具或数据库系统
G16B50/30
数据仓库;计算结构
法律状态
2022-05-06 :
实质审查的生效
IPC(主分类) : G16B 50/30
申请日 : 20211228
2022-04-19 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332