基于深度学习的nanopore测序数据碱基识别方法
授权
摘要

基于深度学习的nanopore测序数据碱基识别方法,涉及生物信息学领域,针对现有技术中nanopore测序准确率低的问题,一:下载包括肺杆菌、肠杆菌、变形杆菌在内的50组nanopore原始数据作为训练集;二:对50组原始数据进行碱基识别,得到碱基序列;三:获取准确率在99%以上的Illumina测序序列,并以准确率在99%以上的Illumina测序序列作为参考基因组,以参考基因组作为ground truth并使用Tombo算法对碱基序列进行校正;四:使用Re‑squiggle方法将校正后的碱基序列转换为对应的电信号数据,然后将电信号数据进行标记;五:利用标记后的电信号数据以及原始数据训练神经网络,并利用训练好的神经网络进行碱基识别。本申请实现了对nanopore测序数据碱基序列高准确的识别。

基本信息
专利标题 :
基于深度学习的nanopore测序数据碱基识别方法
专利标题(英):
暂无
公开(公告)号 :
CN113870949A
申请号 :
CN202111172443.5
公开(公告)日 :
2021-12-31
申请日 :
2021-10-08
授权号 :
CN113870949B
授权日 :
2022-05-17
发明人 :
汪国华高文韬邹权
申请人 :
东北林业大学;电子科技大学长三角研究院(衢州)
申请人地址 :
黑龙江省哈尔滨市香坊区和兴路26号
代理机构 :
哈尔滨市松花江专利商标事务所
代理人 :
刘强
优先权 :
CN202111172443.5
主分类号 :
G16B30/00
IPC分类号 :
G16B30/00  G16B40/20  G06K9/62  G06N3/04  G06N3/08  
IPC结构图谱
G
G部——物理
G16
特别适用于特定应用领域的信息通信技术
G16B
生物信息学,例如特别适用于计算分子生物学中的遗传或蛋白质相关数据处理的信息与通信技术
G16B30/00
特别适用于对核酸或氨基酸进行序列分析的ICT
法律状态
2022-05-17 :
授权
2022-01-21 :
实质审查的生效
IPC(主分类) : G16B 30/00
申请日 : 20211008
2021-12-31 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332