一种基于胶囊神经网络和集成学习的关键蛋白质识别方法
授权
摘要
本发明公开了一种基于胶囊神经网络和集成学习的关键蛋白质识别方法,包括:步骤1:利用Cytoscape工具提取蛋白质在蛋白质相互作用网络中的八种生物学特征;步骤2:使用胶囊神经网络提取八种生物学特征的更深层的增强特征;步骤3:将生物学特征和蛋白质增强特征进行连接;步骤4:将步骤3得到的连接后的特征放入到集成模型Multi‑ensemble中,对模型进行训练,并利用训练好的集成模型预测新的关键蛋白质;步骤5:输出结果。本发明通过胶囊神经网络提取的增强特征比初始的生物学特征更能提高一些机器学习模型预测关键蛋白质的准确性。并且通过融合初始生物学特征和增强特征能进一步提高机器学习模型预测关键蛋白质的准确性。
基本信息
专利标题 :
一种基于胶囊神经网络和集成学习的关键蛋白质识别方法
专利标题(英):
暂无
公开(公告)号 :
CN111584010A
申请号 :
CN202010249587.5
公开(公告)日 :
2020-08-25
申请日 :
2020-04-01
授权号 :
CN111584010B
授权日 :
2022-05-27
发明人 :
彭玮李霞戴伟
申请人 :
昆明理工大学
申请人地址 :
云南省昆明市五华区学府路253号
代理机构 :
昆明人从众知识产权代理有限公司
代理人 :
周宇
优先权 :
CN202010249587.5
主分类号 :
G16B40/20
IPC分类号 :
G16B40/20 G16B25/10 G06N3/04 G06N3/08 G06N20/20
IPC结构图谱
G
G部——物理
G16
特别适用于特定应用领域的信息通信技术
G16B
生物信息学,例如特别适用于计算分子生物学中的遗传或蛋白质相关数据处理的信息与通信技术
G16B40/00
特别适用于生物统计学的ICT;特别适用于与生物信息学相关的机器学习或数据挖掘,例如知识发现或模式发现的ICT
G16B40/20
监督数据分析
法律状态
2022-05-27 :
授权
2020-09-18 :
实质审查的生效
IPC(主分类) : G16B 40/20
申请日 : 20200401
申请日 : 20200401
2020-08-25 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载