蛋白质二级结构预测方法、装置、设备及存储介质
实质审查的生效
摘要

本申请提供一种蛋白质二级结构预测方法、装置、设备及存储介质,首先按照蛋白质序列长度将原始数据集划分为固定区间长度的多个数据子集,原始数据集包括多个序列长度在预设范围内的蛋白质一级结构,然后对每个数据子集进行编码处理对应得到各特征向量,将各特征向量确定为多个训练样本和多个预测样本,再根据多个训练样本、多个预测样本以及目标Stacking模型确定蛋白质二级结构的预测结果。克服蛋白质在不同长度区间内分布不均衡的问题以提高预测准确率。预测所用的目标Stacking模型包括多层同质或者异质Stacking模型,与深度学习相比可以大幅度提升机器学习效果,通过整合多个简单机器学习模型达到适中的学习时长。

基本信息
专利标题 :
蛋白质二级结构预测方法、装置、设备及存储介质
专利标题(英):
暂无
公开(公告)号 :
CN114496068A
申请号 :
CN202210099251.4
公开(公告)日 :
2022-05-13
申请日 :
2022-01-27
授权号 :
暂无
授权日 :
暂无
发明人 :
梁珩琳
申请人 :
中国农业银行股份有限公司
申请人地址 :
北京市东城区建国门内大街69号
代理机构 :
北京同立钧成知识产权代理有限公司
代理人 :
章愫
优先权 :
CN202210099251.4
主分类号 :
G16B15/00
IPC分类号 :
G16B15/00  G16B40/00  G06K9/62  G06N3/04  G06N3/08  
IPC结构图谱
G
G部——物理
G16
特别适用于特定应用领域的信息通信技术
G16B
生物信息学,例如特别适用于计算分子生物学中的遗传或蛋白质相关数据处理的信息与通信技术
G16B15/00
特别适用于分析二维或三维分子结构,例如结构或功能关系、结构排序的ICT
法律状态
2022-05-31 :
实质审查的生效
IPC(主分类) : G16B 15/00
申请日 : 20220127
2022-05-13 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332