一种基于XGBoost的DNA重组位点预测方法
授权
摘要
本发明涉及计算生物学领域,主要是关于一种DNA重组位点的预测方法,特别是涉及到一种基于XGBoost的DNA重组位点预测方法,包括:根据初始数据集的样本对数据进行预处理,平衡正负样本;构建初始XGBoost回归预测模型;利用Optuna框架和平衡后的数据集进行模型的参数寻优;训练优化后的XGBoost回归预测模型;构建评价指标对模型的性能进行评价;根据模型得分的合理判断,对模型进行处理,直到获得稳定的高精度模型;最后输出预测位点的重组率,并经过特征重要性度量为特征打分,输出特征得分图。本发明可移植性好,预测效率高;可以发现尚未知晓的对重组起作用的特征,可以有效改进合成位点的设计方法,提高重组率;具有高度的灵活性和可扩展性。
基本信息
专利标题 :
一种基于XGBoost的DNA重组位点预测方法
专利标题(英):
暂无
公开(公告)号 :
CN114093420A
申请号 :
CN202210024162.3
公开(公告)日 :
2022-02-25
申请日 :
2022-01-11
授权号 :
CN114093420B
授权日 :
2022-05-27
发明人 :
刘振栋陈曦戴琼海李冬雁吕欣荣杨玉荣秦梦颖柏苛李晓峰季向阳刘烨斌张伟胡国胜刘芳含魏珑
申请人 :
山东建筑大学
申请人地址 :
山东省济南市历城区临港开发区凤鸣路1000号
代理机构 :
济南泉城专利商标事务所
代理人 :
李桂存
优先权 :
CN202210024162.3
主分类号 :
G16B20/30
IPC分类号 :
G16B20/30 G06K9/62 G06F17/11
相关图片
IPC结构图谱
G
G部——物理
G16
特别适用于特定应用领域的信息通信技术
G16B
生物信息学,例如特别适用于计算分子生物学中的遗传或蛋白质相关数据处理的信息与通信技术
G16B20/00
特别适用于功能性基因组学或蛋白质组学的,例如基因型-表型关联的ICT
G16B20/30
结合位点或基序检测
法律状态
2022-05-27 :
授权
2022-03-15 :
实质审查的生效
IPC(主分类) : G16B 20/30
申请日 : 20220111
申请日 : 20220111
2022-02-25 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
1、
CN114093420A.PDF
PDF下载