一种基于智能语音交互的多模态拒识方法和系统
实质审查的生效
摘要

本发明涉及人机语音交互技术领域,提供一种基于智能语音交互的多模态拒识方法和系统,提取语音交互过程中语音指令对应的音频信息、语音识别后的文本信息以及同步捕捉到的视觉信息等几种不同模态的异构信息作为多模态数据输入,根据预设融合算法完成异构数据信息的融合,得到融合特征向量代入预设评分规则,获取直观且全面的目标拒识概率,根据目标拒识概率即可直接判断是否执行拒识操作;通过融合多种模态的信息(语音、文本、视频),扩大了语音拒识的信息输入范围,多种模态的信息相互补充、相互增强,从而大大提升拒识的准确度,进而大大提升语音交互系统的可用性和用户体验。

基本信息
专利标题 :
一种基于智能语音交互的多模态拒识方法和系统
专利标题(英):
暂无
公开(公告)号 :
CN114267347A
申请号 :
CN202111282240.1
公开(公告)日 :
2022-04-01
申请日 :
2021-11-01
授权号 :
暂无
授权日 :
暂无
发明人 :
李向阳谢志华王满红
申请人 :
惠州市德赛西威汽车电子股份有限公司
申请人地址 :
广东省惠州市仲恺高新区和畅五路西103号
代理机构 :
广州三环专利商标代理有限公司
代理人 :
叶新平
优先权 :
CN202111282240.1
主分类号 :
G10L15/22
IPC分类号 :
G10L15/22  G10L15/02  G10L15/06  G10L15/26  G10L25/18  G10L25/24  G10L25/30  G10L25/45  
IPC结构图谱
G
G部——物理
G10
乐器;声学
G10L
语音分析或合成;语音识别;语音或声音处理;语音或音频编码或解码
G10L15/00
语音识别
G10L15/22
在语音识别过程中使用的程序
法律状态
2022-04-19 :
实质审查的生效
IPC(主分类) : G10L 15/22
申请日 : 20211101
2022-04-01 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332