一种双语种混合语音识别方法、装置、设备及存储介质
授权
摘要
本申请提供了一种双语种混合语音识别方法、装置、设备及存储介质,方法包括:获取目标语音,其中,目标语音为第一语种与第二语种的混合语音;利用预先建立的双语种混合语音识别模型对目标语音进行识别,获得多个候选识别文本以及多个候选识别文本分别对应的得分,其中,双语种混合语音识别模型能够确定出每个候选识别文本中每个文本单元的文本分类概率和语种分类概率,任一候选识别文本对应的得分根据该候选识别文本中每个文本单元的文本分类概率和语种分类概率确定;根据多个候选识别文本分别对应的得分,从多个候选识别文本中确定出目标语音的目标识别文本。本申请对双语种混合语音具有较好的识别效果,用户体验较好。
基本信息
专利标题 :
一种双语种混合语音识别方法、装置、设备及存储介质
专利标题(英):
暂无
公开(公告)号 :
CN110634487A
申请号 :
CN201911017292.9
公开(公告)日 :
2019-12-31
申请日 :
2019-10-24
授权号 :
CN110634487B
授权日 :
2022-05-17
发明人 :
刘迪源熊世富潘嘉高建清
申请人 :
科大讯飞股份有限公司
申请人地址 :
安徽省合肥市高新区望江西路666号
代理机构 :
北京集佳知识产权代理有限公司
代理人 :
杨华
优先权 :
CN201911017292.9
主分类号 :
G10L15/26
IPC分类号 :
G10L15/26 G10L15/06
IPC结构图谱
G
G部——物理
G10
乐器;声学
G10L
语音分析或合成;语音识别;语音或声音处理;语音或音频编码或解码
G10L15/00
语音识别
G10L15/26
语音—正文识别系统
法律状态
2022-05-17 :
授权
2020-01-24 :
实质审查的生效
IPC(主分类) : G10L 15/26
申请日 : 20191024
申请日 : 20191024
2019-12-31 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载