一种基于多组学数据识别癌症亚型的方法
实质审查的生效
摘要
本发明公开了一种基于多组学数据识别癌症亚型的方法,所述方法是基于核主成分分析的多核聚类预测模型(KpcaMKL),所述预测模型通过如下步骤生成:步骤(1):通过癌症基因组图谱数据库(The Cancer Genome Atlas,TCGA)构建癌症多组学数据集;步骤(2):通过核主成分分析算法对癌症数据集中的各个组学数据进行特征提取;步骤(3):通过高斯核函数对降维后的数据进行核变换得到对应的核矩阵;步骤(4):将各个核矩阵平均加权融合为一个全局特征矩阵;步骤(5):将全局特征矩阵运用到谱聚类算法中,得到的聚类结果即代表癌症的不同亚型;本发明解决了癌症亚型的识别问题,采用基于核PCA的多核聚类方法进行预测,明显提高了预测能力。
基本信息
专利标题 :
一种基于多组学数据识别癌症亚型的方法
专利标题(英):
暂无
公开(公告)号 :
CN114334012A
申请号 :
CN202111541874.4
公开(公告)日 :
2022-04-12
申请日 :
2021-12-16
授权号 :
暂无
授权日 :
暂无
发明人 :
郭菲冯杰唐继军
申请人 :
天津大学
申请人地址 :
天津市南开区卫津路92号
代理机构 :
天津市北洋有限责任专利代理事务所
代理人 :
韩帅
优先权 :
CN202111541874.4
主分类号 :
G16B40/30
IPC分类号 :
G16B40/30 G16B50/00
IPC结构图谱
G
G部——物理
G16
特别适用于特定应用领域的信息通信技术
G16B
生物信息学,例如特别适用于计算分子生物学中的遗传或蛋白质相关数据处理的信息与通信技术
G16B40/00
特别适用于生物统计学的ICT;特别适用于与生物信息学相关的机器学习或数据挖掘,例如知识发现或模式发现的ICT
G16B40/30
无监督数据分析
法律状态
2022-04-29 :
实质审查的生效
IPC(主分类) : G16B 40/30
申请日 : 20211216
申请日 : 20211216
2022-04-12 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载