基于CTC解码器的文本序列识别模型校准方法

实质审查的生效

摘要

本发明公开了基于CTC解码器的文本序列识别模型校准方法，包括：将文本图像支撑集输入至待校准训练模型中，获得文本序列识别结果；利用文本图像支撑集的文本序列识别结果计算上下文混淆矩阵，上下文混淆矩阵用于表征序列中相邻时刻预测字符之间的上下文分布关系；根据上下文混淆矩阵，利用上下文相关预测分布对标签平滑中平滑强度有选择性地进行自适应的变化，以实现序列置信度的自适应校准；基于上下文选择性损失函数重新训练待校准训练模型，输出预测文本序列及校准的置信度。本发明方法将标签平滑扩展到基于CTC解码器的文本序列识别模型上，引入序列间上下文关系，对预测序列进行自适应的校准，使得模型输出预测文本置信度能够更加精准。

基本信息

专利标题：

基于CTC解码器的文本序列识别模型校准方法

专利标题（英）：

暂无

公开（公告）号：

CN114495114A

申请号：

CN202210402975.1

公开（公告）日：

2022-05-13

申请日：

2022-04-18

授权号：

暂无

授权日：

暂无

发明人：

黄双萍罗钰徐可可

申请人：

华南理工大学;人工智能与数字经济广东省实验室（广州）

申请人地址：

广东省广州市天河区五山路381号

代理机构：

东莞卓诚专利代理事务所(普通合伙)

代理人：

朱鹏

优先权：

CN202210402975.1

主分类号：

G06V30/19

IPC分类号：

G06V30/19 G06V30/26 G06K9/62

法律状态

2022-05-31 ：

实质审查的生效

IPC(主分类) : G06V 30/19
申请日 : 20220418

2022-05-13 ：

公开

注：本法律状态信息仅供参考，即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。

文件下载

暂无PDF文件可下载