模型训练、音频处理方法、装置、设备、存储介质及程序

实质审查的生效

摘要

本公开提供了模型训练、音频处理方法、装置、设备、存储介质及程序，涉及人工智能领域，尤其涉及语音交互、自然语言处理、深度学习技术。具体实现方案为：获取第一训练样本，第一训练样本包括：第一纯净唤醒音频和第一回声唤醒音频；通过待训练的回声消除模型对第一回声唤醒音频进行回声消除处理，得到第一预测唤醒音频；根据第一预测唤醒音频和第一纯净唤醒音频，对回声消除模型的模型参数进行更新，更新的目标为：唤醒识别模型对第一预测唤醒音频的唤醒识别结果趋近于对第一纯净唤醒音频的唤醒识别结果。通过上述训练过程，提升了回声消除模型输出的音频能够被唤醒识别模型准确识别的概率，因此，能够提高回声场景下的电子设备的唤醒成功率。

基本信息

专利标题：

模型训练、音频处理方法、装置、设备、存储介质及程序

专利标题（英）：

暂无

公开（公告）号：

CN114512136A

申请号：

CN202210269922.7

公开（公告）日：

2022-05-17

申请日：

2022-03-18

授权号：

暂无

授权日：

暂无

发明人：

陈立邹赛赛许楠

申请人：

北京百度网讯科技有限公司

申请人地址：

北京市海淀区上地十街10号百度大厦2层

代理机构：

北京同立钧成知识产权代理有限公司

代理人：

李哲

优先权：

CN202210269922.7

主分类号：

G10L17/22

IPC分类号：

G10L17/22 G10L17/04 G10L17/18 G10L17/20 G10L17/24

IPC结构图谱

G部——物理

G10

乐器；声学

G10L

语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码

G10L17/00

讲话者辨认或验证

G10L17/22

交互程序，人-机界面

法律状态

2022-06-03 ：

实质审查的生效

IPC(主分类) : G10L 17/22
申请日 : 20220318

2022-05-17 ：

公开

注：本法律状态信息仅供参考，即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。

文件下载

暂无PDF文件可下载