语音增强方法、装置、存储介质及电子设备
授权
摘要

本公开涉及一种语音增强方法、装置、存储介质和电子设备,所述方法包括:获取待处理的耳语数据;通过语音增强模型对所述耳语数据进行处理,以得到所述耳语数据对应的声学特征信息,其中,所述语音增强模型包括编码子模型和解码子模型,所述编码子模型用于对所述耳语进行编码,获得目标编码信息,所述解码子模型通过逐步单调注意力机制对所述目标编码信息进行解码,获得所述声学特征信息;根据所述声学特征信息进行语音合成,以得到与所述耳语数据对应的音频信息。由此,可以对耳语数据进行增强,从而可以增加该耳语数据的可懂度,便于用户之间交互和机器识别。并且,可以降低数据处理量,提高语音增强方法的处理效率,进一步提升用户使用体验。

基本信息
专利标题 :
语音增强方法、装置、存储介质及电子设备
专利标题(英):
暂无
公开(公告)号 :
CN111916095A
申请号 :
CN202010773818.2
公开(公告)日 :
2020-11-10
申请日 :
2020-08-04
授权号 :
CN111916095B
授权日 :
2022-05-17
发明人 :
殷翔
申请人 :
北京字节跳动网络技术有限公司
申请人地址 :
北京市石景山区实兴大街30号院3号楼2层B-0035房间
代理机构 :
北京英创嘉友知识产权代理事务所(普通合伙)
代理人 :
魏嘉熹
优先权 :
CN202010773818.2
主分类号 :
G10L21/02
IPC分类号 :
G10L21/02  G10L19/16  G10L13/04  
IPC结构图谱
G
G部——物理
G10
乐器;声学
G10L
语音分析或合成;语音识别;语音或声音处理;语音或音频编码或解码
G10L21/00
为了改变语音或声音信号的质量或其可识度而处理语音或声音信号,以产生另一种可听的或非可听的信号,例如视觉信号或触觉信号
G10L21/02
语音增强,例如降低噪声或消除回声
法律状态
2022-05-17 :
授权
2020-11-27 :
实质审查的生效
IPC(主分类) : G10L 21/02
申请日 : 20200804
2020-11-10 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332