一种基于拼接特征的语种识别方法
授权
摘要

本发明公开了一种基于拼接特征的语种识别方法,步骤1,获得语音信号的帧序列;步骤2,计算时长特征;步骤3,提取语音帧序列的底层声学特征;步骤4,得到音素特征序列;步骤5,获得拼接特征;步骤6,将拼接特征输入到i‑vector提取器中,提取得到语音帧序列的i‑vector特征表示;步骤7,得到lda‑vector特征;步骤8,将lda‑vector特征输入到训练好的分类器中,获得输入语音帧序列的语种标签。与现有技术相比,本发明结合了高层和底层声学特征这两种特征的优点;无需训练多个音素识别器,只需要提取高层声学特征;降低复杂度的同时,提高对语音信号的语种识别性能特别是语种识别准确率。

基本信息
专利标题 :
一种基于拼接特征的语种识别方法
专利标题(英):
暂无
公开(公告)号 :
CN111599344A
申请号 :
CN202010244083.4
公开(公告)日 :
2020-08-28
申请日 :
2020-03-31
授权号 :
CN111599344B
授权日 :
2022-05-17
发明人 :
刘俊南江海王化刘文龙
申请人 :
因诺微科技(天津)有限公司
申请人地址 :
天津市滨海新区华苑产业区(环外)海泰发展五道16号B-6号楼-1-502
代理机构 :
天津市北洋有限责任专利代理事务所
代理人 :
李素兰
优先权 :
CN202010244083.4
主分类号 :
G10L15/00
IPC分类号 :
G10L15/00  G10L15/02  G10L15/06  
IPC结构图谱
G
G部——物理
G10
乐器;声学
G10L
语音分析或合成;语音识别;语音或声音处理;语音或音频编码或解码
G10L15/00
语音识别
法律状态
2022-05-17 :
授权
2021-06-08 :
实质审查的生效
IPC(主分类) : G10L 15/00
申请日 : 20200331
2020-08-28 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332