基于人工智能的字幕提取方法、装置、设备和存储介质
实质审查的生效
摘要

本发明提供了一种基于人工智能的字幕提取方法、装置、设备和存储介质,包括:获取目标文本框图像;将目标文本框图像输入至训练好的识别模型,以识别得到目标文本框图像中的目标文本,识别模型包括文本图像信息提取网络、语言模型信息提取网络和联合前馈神经网络,文本图像信息提取网络由样本文本框图像预训练得到,语言模型信息提取网络由样本视频文本预训练得到,联合前馈神经网络用于将两者提取网络在预训练之后的权重参数进行结合。本发明能够将文本图像信息提取和语言模型信息提取的结果通过联合前馈神经网络将二者结合,弥补CTC条件独立性假设带来的问题,在预测时能够利用图像纹理特征和语言特征,减少了替换错误,提高了文字识别准确度。

基本信息
专利标题 :
基于人工智能的字幕提取方法、装置、设备和存储介质
专利标题(英):
暂无
公开(公告)号 :
CN114359942A
申请号 :
CN202210027244.3
公开(公告)日 :
2022-04-15
申请日 :
2022-01-11
授权号 :
暂无
授权日 :
暂无
发明人 :
庞烨高欣建韩茂琨刘玉宇肖京
申请人 :
平安科技(深圳)有限公司
申请人地址 :
广东省深圳市福田区福田街道福安社区益田路5033号平安金融中心23楼
代理机构 :
广州嘉权专利商标事务所有限公司
代理人 :
麦广林
优先权 :
CN202210027244.3
主分类号 :
G06V30/414
IPC分类号 :
G06V30/414  G06V20/40  G06N3/04  G06N3/08  G06V30/10  G06V10/82  
法律状态
2022-05-03 :
实质审查的生效
IPC(主分类) : G06V 30/414
申请日 : 20220111
2022-04-15 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332