基于卷积神经网络-转换器混合架构的图像分类方法
实质审查的生效
摘要
本发明公开了一种基于卷积神经网络‑转换器混合架构的图像分类方法。该方法包括:利用预训练卷积神经网络提取图像的特征并生成指示目标位置轮廓的注意力掩码,该注意力掩码表征对应元素属于目标类别的概率;将所述注意力掩码作为先验信息指导转换器网络,以关注辨识性区域来确定图像类别,其中所述转换器网络是以设定的损失函数为优化目标经训练获得。本发明能自动发现目标辨识性的区域,并学习该区域的特征以供区分类别,从而提升了细粒度图像分类的准确性。
基本信息
专利标题 :
基于卷积神经网络-转换器混合架构的图像分类方法
专利标题(英):
暂无
公开(公告)号 :
CN114359622A
申请号 :
CN202111479058.5
公开(公告)日 :
2022-04-15
申请日 :
2021-12-06
授权号 :
暂无
授权日 :
暂无
发明人 :
苏童宋呈群程俊
申请人 :
中国科学院深圳先进技术研究院
申请人地址 :
广东省深圳市南山区深圳大学城学苑大道1068号
代理机构 :
北京市诚辉律师事务所
代理人 :
耿慧敏
优先权 :
CN202111479058.5
主分类号 :
G06V10/764
IPC分类号 :
G06V10/764 G06V10/774 G06V10/82 G06N3/04 G06N3/08 G06K9/62
法律状态
2022-05-03 :
实质审查的生效
IPC(主分类) : G06V 10/764
申请日 : 20211206
申请日 : 20211206
2022-04-15 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载