基于Swin Transformer的手写文字识别方法及...
实质审查的生效
摘要
本申请涉及一种基于Swin Transformer的手写文字识别方法及系统,包括获取待识别手写图片;基于Swin Transformer建立Swin‑T编码结构,并基于所述Swin‑T编码结构对所述待识别手写图片进行特征抽取,并获取当前图像特征;将所述当前图像特征输入至预设的设定解码器,并基于所述设定解码器获取解码器特征,其中,所述设定解码器采用3个串联的transformer;将所述解码器特征放进softmax分类器进行文字预测,并获取当前预测文字,采用Swin Transformer建立Swin‑T编码结构,通过Swin‑T编码结构,作为编码器来抽取图像的特征,有助于降低模型的计算复杂度,让特征具备全局感受野,另,利用Swin Transformer作为骨干网络,能够更好的抽取手写文字背后隐藏的特征,进而极大提高文字识别准确率。
基本信息
专利标题 :
基于Swin Transformer的手写文字识别方法及系统
专利标题(英):
暂无
公开(公告)号 :
CN114445808A
申请号 :
CN202210071314.5
公开(公告)日 :
2022-05-06
申请日 :
2022-01-21
授权号 :
暂无
授权日 :
暂无
发明人 :
曾祥云朱姬渊
申请人 :
上海易康源医疗健康科技有限公司
申请人地址 :
上海市浦东新区中国(上海)自由贸易试验区临港新片区新杨公路860号10幢
代理机构 :
上海硕力知识产权代理事务所(普通合伙)
代理人 :
王法男
优先权 :
CN202210071314.5
主分类号 :
G06V20/62
IPC分类号 :
G06V20/62 G06V30/10 G06V10/44 G06V10/764 G06K9/62 G06N3/04
法律状态
2022-05-24 :
实质审查的生效
IPC(主分类) : G06V 20/62
申请日 : 20220121
申请日 : 20220121
2022-05-06 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载