语音识别与音视频处理方法、设备、系统及存储介质
实质审查的生效
摘要
本申请实施例提供一种语音识别与音视频处理方法、设备、系统及存储介质。在本申请实施例中,通过对音视频数据进行切分,为并行进行语音检测和语音识别提供基础,而且考虑到切分音视频数据可能出现不合理的情况,在语音识别之前,先对语音检测得到的语音片段进行规整化处理,之后对规整化后的语音片段进行语音识别,保证语音识别的质量;在整个过程中,并行进行语音检测和语音识别,有利于节约语音识别的耗时,提高语音识别的效率,进而提高用户体验。
基本信息
专利标题 :
语音识别与音视频处理方法、设备、系统及存储介质
专利标题(英):
暂无
公开(公告)号 :
CN114360545A
申请号 :
CN202011034174.1
公开(公告)日 :
2022-04-15
申请日 :
2020-09-27
授权号 :
暂无
授权日 :
暂无
发明人 :
王凯
申请人 :
阿里巴巴集团控股有限公司
申请人地址 :
英属开曼群岛大开曼资本大厦一座四层847号邮箱
代理机构 :
北京太合九思知识产权代理有限公司
代理人 :
张爱
优先权 :
CN202011034174.1
主分类号 :
G10L15/26
IPC分类号 :
G10L15/26 G10L15/18 G10L25/87 G10L15/14 H04N21/845 H04N21/488 H04N21/234 H04N21/233 H04N21/44 H04N21/439 H04N21/235 H04N21/435
IPC结构图谱
G
G部——物理
G10
乐器;声学
G10L
语音分析或合成;语音识别;语音或声音处理;语音或音频编码或解码
G10L15/00
语音识别
G10L15/26
语音—正文识别系统
法律状态
2022-05-03 :
实质审查的生效
IPC(主分类) : G10L 15/26
申请日 : 20200927
申请日 : 20200927
2022-04-15 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载