一种语音识别场景下音量自适应方法及装置

实质审查的生效

摘要

一种语音识别场景下音量自适应方法和系统，提取用户语音中的声纹特征，根据声纹特征进行用户对象区分；获取麦克风的属性信息，将麦克风的属性信息保存到第一数据库；第一数据库中构建有用户账号‑麦克风信息‑音量最优值表，通过用户账号‑麦克风信息‑音量最优值表记录用户账号、麦克风信息和音量最优值的关系；根据用户的声纹特征、用户账号、麦克风信息和音量最优值对麦克风的录音音量进行适配。同时对给定用户进行麦克风录音音量训练，获取麦克风录音音量最优值。本发明通过声纹技术合麦克风录音音量训练，形成了用户、麦克风、最优值的关系型数据，提升了语音识别的准确率；节约了大量技术人员的重复设置工作；实现麦克风数据更新和积累。

基本信息

专利标题：

一种语音识别场景下音量自适应方法及装置

专利标题（英）：

暂无

公开（公告）号：

CN114464190A

申请号：

CN202210113027.6

公开（公告）日：

2022-05-10

申请日：

2022-01-30

授权号：

暂无

授权日：

暂无

发明人：

赵东阳李霄寒

申请人：

云知声智能科技股份有限公司

申请人地址：

北京市海淀区西三旗建材城内1幢一层101号

代理机构：

代理人：

优先权：

CN202210113027.6

主分类号：

G10L17/02

IPC分类号：

G10L17/02 G10L17/04 G10L15/08 H04R1/08 G06F16/28

IPC结构图谱

G部——物理

G10

乐器；声学

G10L

语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码

G10L17/00

讲话者辨认或验证

G10L17/02

预处理操作，例如：片断选择；模式表示或模拟，例如基于线性判别式分析或主要部件；特征选择或提取

法律状态

2022-05-27 ：

实质审查的生效

IPC(主分类) : G10L 17/02
申请日 : 20220130

2022-05-10 ：

公开

注：本法律状态信息仅供参考，即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。

文件下载

暂无PDF文件可下载