模型训练方法、语音处理方法及其装置

授权

摘要

本申请提供一种模型训练方法、语音处理方法及其装置。该模型训练方法包括：获取样本数据对话语音信号以及对话语音信号对应的对话文本信息和标签数据；将对话语音信号和对话文本信息输入第一融合模型进行特征融合处理，得到第一预测融合特征；将第一预测融合特征输入分类模型进行分类处理，得到预测分类结果；采用交叉熵损失函数，确定预测分类结果和标签数据的第一损失值；若第一损失值大于或等于第一损失值阈值，则调整第一融合模型和分类模型的模型参数；否则，得到训练完成的第一融合模型和分类模型。本申请训练得到的第一融合模型和分类模型能够准确的确定接收到的语音信号对应的用户意图是否用来打断机器客服输出的语音信号。

基本信息

专利标题：

模型训练方法、语音处理方法及其装置

专利标题（英）：

暂无

公开（公告）号：

CN114267345A

申请号：

CN202210173741.4

公开（公告）日：

2022-04-01

申请日：

2022-02-25

授权号：

CN114267345B

授权日：

2022-05-17

发明人：

林廷恩武玉川李永彬孙健

申请人：

阿里巴巴达摩院（杭州）科技有限公司

申请人地址：

浙江省杭州市余杭区五常街道文一西路969号3幢5层516室

代理机构：

北京同钧律师事务所

代理人：

李小波

优先权：

CN202210173741.4

主分类号：

G10L15/06

IPC分类号：

G10L15/06 G10L15/22 G10L15/26

IPC结构图谱

G部——物理

G10

乐器；声学

G10L

语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码

G10L15/00

语音识别

G10L15/06

创建基准模板；训练语音识别系统，例如对说话者声音特征的适应

法律状态

2022-05-17 ：

授权

2022-04-19 ：

实质审查的生效

IPC(主分类) : G10L 15/06
申请日 : 20220225

2022-04-01 ：

公开

注：本法律状态信息仅供参考，即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。

文件下载

暂无PDF文件可下载