一种语音交互方法和装置
授权
摘要
本发明实施例公开了一种语音交互方法和装置,该方法包括:在检测到语音输入功能被唤醒时,获取语音输入信息;根据预存的第一噪声频谱信息,对所述语音输入信息进行分离操作,生成人声频谱信息和第二噪声频谱信息;根据所述第二噪声频谱信息确定第一音量幅值,并根据所述人声频谱信息确定人声平均幅值;根据所述第一音量幅值与所述人声平均幅值之间的幅值关系,提供匹配的语音提醒信息。本发明实施例的技术方案,通过获取到的周围环境的噪声信息,对用户输入的语音信息进行分离,生成人声频谱信息,实现了对用户输入语音的音量引导,保证了用户的说话声音符合语音输入功能的识别要求,提高了语音识别正确率。
基本信息
专利标题 :
一种语音交互方法和装置
专利标题(英):
暂无
公开(公告)号 :
CN110097884A
申请号 :
CN201910502349.8
公开(公告)日 :
2019-08-06
申请日 :
2019-06-11
授权号 :
CN110097884B
授权日 :
2022-05-17
发明人 :
王夏鸣
申请人 :
大众问问(北京)信息科技有限公司
申请人地址 :
北京市海淀区北三环西路25号27号楼三层3011室
代理机构 :
北京品源专利代理有限公司
代理人 :
孟金喆
优先权 :
CN201910502349.8
主分类号 :
G10L15/22
IPC分类号 :
G10L15/22 G10L25/78 G10L25/84
IPC结构图谱
G
G部——物理
G10
乐器;声学
G10L
语音分析或合成;语音识别;语音或声音处理;语音或音频编码或解码
G10L15/00
语音识别
G10L15/22
在语音识别过程中使用的程序
法律状态
2022-05-17 :
授权
2019-08-30 :
实质审查的生效
IPC(主分类) : G10L 15/22
申请日 : 20190611
申请日 : 20190611
2019-08-06 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载