基于自集成学习的高度噪声数据处理方法与系统
公开
摘要
本发明提出一种基于自集成学习的高度噪声数据处理方法与系统,该方法包括如下步骤:采用基于假阴率的第一交叉熵损失函数,在高度噪声的训练样本集合中对深度神经网络模型进行训练直至收敛,以在验证集合上得到集成模型;根据集成模型,得到在训练样本集合中每个训练样本对应的预测标签值,对每个训练样本通过预测标签值以及原始标签进行更新以得到更新后的标签,进而得到标签更新后的训练样本集合;在标签更新后的训练样本集合上,使用集成模型以初始化目标模型的参数,并采用基于假阴率的第二交叉熵损失函数充分训练目标模型直至收敛。本发明可降低噪声对训练的干扰,并提高目标模型对稀有类别的表现。
基本信息
专利标题 :
基于自集成学习的高度噪声数据处理方法与系统
专利标题(英):
暂无
公开(公告)号 :
CN114297335A
申请号 :
CN202210226368.4
公开(公告)日 :
2022-04-08
申请日 :
2022-03-09
授权号 :
暂无
授权日 :
暂无
发明人 :
刘伟龚杰余晓霞张苗辉
申请人 :
华东交通大学
申请人地址 :
江西省南昌市经济技术开发区双港东大街808号
代理机构 :
北京中济纬天专利代理有限公司
代理人 :
黄攀
优先权 :
CN202210226368.4
主分类号 :
G06F16/31
IPC分类号 :
G06F16/31 G06F16/35 G06N3/04
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06F
电数字数据处理
G06F16/31
••索引;其数据结构;存储结构
法律状态
2022-04-08 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载