用于车辆的语音交互方法及系统
授权
摘要
本发明实施例提供一种用于车辆的语音交互方法。该方法包括:采集来自车辆内每个座位的声音信息和视频信息;对声音信息进行语音识别,并基于语音识别结果对声音信息进行第一打分;基于语音识别结果对应的基准口型的视频图像,对视频信息中的乘客的口型进行第二打分;对第一打分结果和第二打分结果进行综合判断,确定是否进行语音交互。本发明实施例还提供一种用于车辆的语音交互系统。本发明实施例利用图像识别算法对每个座位用户的口型进行实时检测识别。通过口型与声音的多重因素判断是否进行语音交互,提升全车内语音识别效果和交互准确率,并且考虑到车内的多种会影响声音信号和视频信号的音素进行弹性处理。从而进一步提升语音交互效果。
基本信息
专利标题 :
用于车辆的语音交互方法及系统
专利标题(英):
暂无
公开(公告)号 :
CN112927688A
申请号 :
CN202110096485.9
公开(公告)日 :
2021-06-08
申请日 :
2021-01-25
授权号 :
CN112927688B
授权日 :
2022-05-10
发明人 :
符晓乐
申请人 :
思必驰科技股份有限公司
申请人地址 :
江苏省苏州市苏州工业园区新平街388号腾飞创新园14栋
代理机构 :
北京商专永信知识产权代理事务所(普通合伙)
代理人 :
黄谦
优先权 :
CN202110096485.9
主分类号 :
G10L15/22
IPC分类号 :
G10L15/22 G10L15/26 G10L21/02 G10L21/0216 G10L21/0272
相关图片
IPC结构图谱
G
G部——物理
G10
乐器;声学
G10L
语音分析或合成;语音识别;语音或声音处理;语音或音频编码或解码
G10L15/00
语音识别
G10L15/22
在语音识别过程中使用的程序
法律状态
2022-05-10 :
授权
2021-06-25 :
实质审查的生效
IPC(主分类) : G10L 15/22
申请日 : 20210125
申请日 : 20210125
2021-06-08 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
1、
CN112927688A.PDF
PDF下载