一种利用双层概率模型聚类宏基因组序列的方法
实质审查的生效
摘要

本发明涉及宏基因组序列聚类技术领域,尤其涉及一种利用双层概率模型聚类宏基因组序列的方法,包括P1,利用第一层概率模型对初始宏基因组中的所有序列进行聚类,获得多个初级聚类;P2,利用第二层概率模型对每一个初级聚类进行再次聚类,获得最终聚类;所述第二层模型包括种子选择模型、k‑mer频率概率模型和覆盖度概率模型。本发明采用的利用双层概率模型聚类宏基因组序列的方法利用两层模型对初始宏基因组中的所有序列进行处理,能够有效利用宏基因组序列不同维度的特征,适用于所有宏基因组测序数据,例如肠道微生物数据、土壤微生物数据和水微生物数据等。

基本信息
专利标题 :
一种利用双层概率模型聚类宏基因组序列的方法
专利标题(英):
暂无
公开(公告)号 :
CN114446394A
申请号 :
CN202210103106.9
公开(公告)日 :
2022-05-06
申请日 :
2022-01-27
授权号 :
暂无
授权日 :
暂无
发明人 :
杨铁林刘聪聪郭燕董珊珊
申请人 :
西安交通大学
申请人地址 :
陕西省西安市咸宁西路28号
代理机构 :
西安通大专利代理有限责任公司
代理人 :
王艾华
优先权 :
CN202210103106.9
主分类号 :
G16B40/00
IPC分类号 :
G16B40/00  
IPC结构图谱
G
G部——物理
G16
特别适用于特定应用领域的信息通信技术
G16B
生物信息学,例如特别适用于计算分子生物学中的遗传或蛋白质相关数据处理的信息与通信技术
G16B40/00
特别适用于生物统计学的ICT;特别适用于与生物信息学相关的机器学习或数据挖掘,例如知识发现或模式发现的ICT
法律状态
2022-05-24 :
实质审查的生效
IPC(主分类) : G16B 40/00
申请日 : 20220127
2022-05-06 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332