发音检错方法及装置、语音评分方法及装置
实质审查的生效
摘要

本公开披露了一种发音检错方法及装置、语音评分方法及装置,涉及音频处理技术领域。该发音检错方法包括:确定待检错朗读语音的状态序列;确定待检错朗读语音对应的朗读文本包含的音素各自对应的N音素时间边界信息;基于状态序列和朗读文本包含的音素各自对应的N音素时间边界信息,生成音素聚合数据;基于音素聚合数据,确定朗读文本包含的音素各自对应的检错信息。由于音素聚合数据是基于朗读文本包含的音素各自对应的N音素时间边界信息对状态序列进行多尺度聚合操作后生成的,因此,音素聚合数据能够包含不同尺度的音素局部信息和音素全局信息。由此可见,本公开能够借助音素聚合数据提高检错精准度和检错稳定性。

基本信息
专利标题 :
发音检错方法及装置、语音评分方法及装置
专利标题(英):
暂无
公开(公告)号 :
CN114495986A
申请号 :
CN202111678431.X
公开(公告)日 :
2022-05-13
申请日 :
2021-12-31
授权号 :
暂无
授权日 :
暂无
发明人 :
杨琴吴奎盛志超金海李芳足张志勇
申请人 :
科大讯飞股份有限公司
申请人地址 :
安徽省合肥市高新区望江西路666号
代理机构 :
北京布瑞知识产权代理有限公司
代理人 :
宗广静
优先权 :
CN202111678431.X
主分类号 :
G10L25/60
IPC分类号 :
G10L25/60  G10L15/08  G10L15/05  G10L15/02  
IPC结构图谱
G
G部——物理
G10
乐器;声学
G10L
语音分析或合成;语音识别;语音或声音处理;语音或音频编码或解码
G10L25/00
不限于组G10L 15/00-G10L 21/00的语言或者声音分析技术
G10L25/48
专门适用于特定用途
G10L25/51
比较或判别
G10L25/60
语音信号的质量检测
法律状态
2022-05-31 :
实质审查的生效
IPC(主分类) : G10L 25/60
申请日 : 20211231
2022-05-13 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332