基于年龄向量的语音识别方法、装置及设备
公开
摘要
本发明提供一种基于年龄向量的语音识别方法、装置及设备,该方法包括:获取训练数据,训练数据包括多条语音文件及对应的标注,标注为语音文件对应的年龄和性别;获取预设的说话人年龄向量提取器;通过训练数据对说话人年龄向量提取器进行多轮迭代训练,训练完成后,得到训练好的说话人年龄向量提取器;获取说话人语音;将说话人语音输入训练好的说话人年龄向量提取器,输出说话人年龄向量;将说话人年龄向量和说话人语音输入预设的声学模型网络,输出语音识别结果。本发明通过训练说话人年龄向量提取器提取说话人年龄向量,同时根据说话人年龄向量和说话人语音综合进行语音识别预测,能够识别不同年龄段的语音,且提高了语音识别的准确率。
基本信息
专利标题 :
基于年龄向量的语音识别方法、装置及设备
专利标题(英):
暂无
公开(公告)号 :
CN114582326A
申请号 :
CN202210055243.X
公开(公告)日 :
2022-06-03
申请日 :
2022-01-18
授权号 :
暂无
授权日 :
暂无
发明人 :
秦艳姣杨莉王海军雷建军
申请人 :
湖北第二师范学院
申请人地址 :
湖北省武汉市东湖新技术开发区高新二路129号
代理机构 :
武汉知产时代知识产权代理有限公司
代理人 :
马帅
优先权 :
CN202210055243.X
主分类号 :
G10L15/06
IPC分类号 :
G10L15/06 G10L15/02 G10L15/22 G10L15/30
IPC结构图谱
G
G部——物理
G10
乐器;声学
G10L
语音分析或合成;语音识别;语音或声音处理;语音或音频编码或解码
G10L15/00
语音识别
G10L15/06
创建基准模板;训练语音识别系统,例如对说话者声音特征的适应
法律状态
2022-06-03 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载