语音监督数据获取方法、装置、电子设备及存储介质
实质审查的生效
摘要
本公开关于一种语音监督数据获取方法、装置、电子设备及存储介质,该方法包括:确定候选视频中的多个视频帧图像;对多个视频帧图像进行文本识别,得到每个视频帧图像对应的第一文本串;对多个视频帧图像对应的第一文本串进行处理,得到多个视频帧图像对应的候选文本,并确定与候选文本对应的起始时间点和结束时间点;从候选视频的音频文件中提取起始时间点和结束时间点之间的音频数据,得到候选文本对应的音频数据;对候选文本对应的音频数据进行语音识别,得到候选文本对应的识别文本;根据候选文本和识别文本,确定音频数据对应的目标文本,并将目标文本确定为音频数据对应的标注数据。本公开可以减少人力成本,提高标注效率。
基本信息
专利标题 :
语音监督数据获取方法、装置、电子设备及存储介质
专利标题(英):
暂无
公开(公告)号 :
CN114387589A
申请号 :
CN202111524667.8
公开(公告)日 :
2022-04-22
申请日 :
2021-12-14
授权号 :
暂无
授权日 :
暂无
发明人 :
曲贺单亚慧
申请人 :
北京达佳互联信息技术有限公司
申请人地址 :
北京市海淀区上地西路6号1幢1层101D1-7
代理机构 :
北京润泽恒知识产权代理有限公司
代理人 :
吕俊秀
优先权 :
CN202111524667.8
主分类号 :
G06V20/62
IPC分类号 :
G06V20/62 G10L15/22 G10L15/26
法律状态
2022-05-10 :
实质审查的生效
IPC(主分类) : G06V 20/62
申请日 : 20211214
申请日 : 20211214
2022-04-22 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载