用于视频字幕识别的方法及装置、电子设备、存储介质
公开
摘要
本申请涉及视频处理技术领域,公开一种用于视频字幕识别的方法,包括:对多个视频帧进行文字识别,获得每个视频帧中的全部文本框;根据文本框高度的出现次数,确定多个文本框集合;计算每个文本框集合的文本框宽度均方差;根据各文本框宽度均方差确定字幕。由于视频中文本框高度相同,但是不同视频帧中的文本框宽度不同,因此,通过文本框高度和文本框宽度能够准确的识别到视频字幕的文本框。在进行不同类别视频字幕识别时,无需考虑视频的尺寸和字幕位置等信息,也不需要人工标注进行字幕分类。本申请还公开一种用于视频字幕识别的装置、电子设备及存储介质。
基本信息
专利标题 :
用于视频字幕识别的方法及装置、电子设备、存储介质
专利标题(英):
暂无
公开(公告)号 :
CN114581900A
申请号 :
CN202210232824.6
公开(公告)日 :
2022-06-03
申请日 :
2022-03-09
授权号 :
暂无
授权日 :
暂无
发明人 :
安达唐大闰
申请人 :
北京明略昭辉科技有限公司
申请人地址 :
北京市海淀区北三环西路25号27号楼二层2020室
代理机构 :
北京康盛知识产权代理有限公司
代理人 :
高会会
优先权 :
CN202210232824.6
主分类号 :
G06V20/62
IPC分类号 :
G06V20/62
法律状态
2022-06-03 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载