一种基于深度学习的语音端点检测方法及系统
授权
摘要

本发明公开了一种基于深度学习的语音端点检测方法及系统,包括:利用收集的音频数据生成样本音频数据;分帧处理样本音频数据,划分处理后得到的待训练语音帧为非噪声语音帧和噪声语音帧,获得训练集;利用训练集训练深度神经网络模型,获得训练后的深度神经网络模型;将端点待检测语音数据输入该训练后的模型,输出该语音数据中的所有非噪声语音帧和噪声语音帧;基于非噪声语音帧和噪声语音帧,获得端点待检测语音数据中的非噪声语音段和噪声语音段,提取所有的非噪声语音段在端点待检测语音数据中的起始坐标索引和结束坐标索引为语音端点。本发明解决了传统语音端点检测技术低信噪比识别准确率低、部分方法识别速度慢和语音特征选取困难的问题。

基本信息
专利标题 :
一种基于深度学习的语音端点检测方法及系统
专利标题(英):
暂无
公开(公告)号 :
CN110706694A
申请号 :
CN201910917881.6
公开(公告)日 :
2020-01-17
申请日 :
2019-09-26
授权号 :
CN110706694B
授权日 :
2022-04-08
发明人 :
不公告发明人
申请人 :
成都数之联科技有限公司
申请人地址 :
四川省成都市武侯区一环路西一段菊乐路口1栋4层2号
代理机构 :
成都行之专利代理事务所(普通合伙)
代理人 :
熊曦
优先权 :
CN201910917881.6
主分类号 :
G10L15/05
IPC分类号 :
G10L15/05  G10L15/06  G10L15/16  G10L25/78  
IPC结构图谱
G
G部——物理
G10
乐器;声学
G10L
语音分析或合成;语音识别;语音或声音处理;语音或音频编码或解码
G10L15/00
语音识别
G10L15/04
分段;字极限检测
G10L15/05
字边界检测
法律状态
2022-04-08 :
授权
2022-04-01 :
著录事项变更
IPC(主分类) : G10L 15/05
变更事项 : 申请人
变更前 : 成都数之联科技有限公司
变更后 : 成都数之联科技股份有限公司
变更事项 : 地址
变更前 : 610000 四川省成都市武侯区一环路西一段菊乐路口1栋4层2号
变更后 : 610000 四川省成都市武侯区锦绣街8号2层270号
2020-02-18 :
实质审查的生效
IPC(主分类) : G10L 15/05
申请日 : 20190926
2020-01-17 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332