用于在基因组图中有效识别和提取序列路径的系统和方法
公开
摘要

一种用于由处理器存储表示多个个体基因组的基因组图的方法,包括:在数据存储装置中存储参考基因组的线性表示;接收第一基因组;根据所述参考基因组来识别所述第一基因组中的变化;根据所述参考基因组来生成针对所述第一基因组中的每个变化的图边缘;针对每个生成的图边缘生成:边缘标识符,其唯一地标识所述基因组图中的当前边缘;开始边缘标识符,其标识所述当前边缘从中分支的边缘;开始位置,其指示在开始边缘上充当所述当前边缘的锚定点的位置;结束边缘标识符,其标识所述当前边缘加入其中的边缘;结束位置,其指示在结束边缘上充当所述当前边缘的锚定点的位置;以及序列,其指示所述当前边缘的核苷酸序列;并且在所述数据存储装置中存储针对每个生成的图边缘的所述边缘标识符、所述开始边缘标识符、所述开始位置、所述结束边缘标识符、所述结束边缘位置以及所述序列。基于该基因组图数据结构,我们进一步提出了一种用于指定可以遍历一个或多个边缘的路径的方案以及扩展诸如SAM、VCF和MPEG‑G之类的现有基因组数据格式以支持通过使用我们提出的坐标系来使用基因组图参考的方法。

基本信息
专利标题 :
用于在基因组图中有效识别和提取序列路径的系统和方法
专利标题(英):
暂无
公开(公告)号 :
CN114503206A
申请号 :
CN202080069634.6
公开(公告)日 :
2022-05-13
申请日 :
2020-09-29
授权号 :
暂无
授权日 :
暂无
发明人 :
Y·H·张
申请人 :
皇家飞利浦有限公司
申请人地址 :
荷兰艾恩德霍芬
代理机构 :
永新专利商标代理有限公司
代理人 :
刘兆君
优先权 :
CN202080069634.6
主分类号 :
G16B30/10
IPC分类号 :
G16B30/10  G16B30/20  
IPC结构图谱
G
G部——物理
G16
特别适用于特定应用领域的信息通信技术
G16B
生物信息学,例如特别适用于计算分子生物学中的遗传或蛋白质相关数据处理的信息与通信技术
G16B30/00
特别适用于对核酸或氨基酸进行序列分析的ICT
G16B30/10
序列排列;同源搜索
法律状态
2022-05-13 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332