基于年龄向量的语音识别方法、装置及设备

公开

摘要

本发明提供一种基于年龄向量的语音识别方法、装置及设备，该方法包括：获取训练数据，训练数据包括多条语音文件及对应的标注，标注为语音文件对应的年龄和性别；获取预设的说话人年龄向量提取器；通过训练数据对说话人年龄向量提取器进行多轮迭代训练，训练完成后，得到训练好的说话人年龄向量提取器；获取说话人语音；将说话人语音输入训练好的说话人年龄向量提取器，输出说话人年龄向量；将说话人年龄向量和说话人语音输入预设的声学模型网络，输出语音识别结果。本发明通过训练说话人年龄向量提取器提取说话人年龄向量，同时根据说话人年龄向量和说话人语音综合进行语音识别预测，能够识别不同年龄段的语音，且提高了语音识别的准确率。

基本信息

专利标题：

基于年龄向量的语音识别方法、装置及设备

专利标题（英）：

暂无

公开（公告）号：

CN114582326A

申请号：

CN202210055243.X

公开（公告）日：

2022-06-03

申请日：

2022-01-18

授权号：

暂无

授权日：

暂无

发明人：

秦艳姣杨莉王海军雷建军

申请人：

湖北第二师范学院

申请人地址：

湖北省武汉市东湖新技术开发区高新二路129号

代理机构：

武汉知产时代知识产权代理有限公司

代理人：

马帅

优先权：

CN202210055243.X

主分类号：

G10L15/06

IPC分类号：

G10L15/06 G10L15/02 G10L15/22 G10L15/30

IPC结构图谱

G部——物理

G10

乐器；声学

G10L

语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码

G10L15/00

语音识别

G10L15/06

创建基准模板；训练语音识别系统，例如对说话者声音特征的适应

法律状态

2022-06-03 ：

公开

注：本法律状态信息仅供参考，即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。

文件下载

暂无PDF文件可下载