一种基于深度卷积生成对抗网络的音频关键词识别方法
授权
摘要
本发明公开了一种基于深度卷积生成对抗网络的音频关键词识别方法,其特征在于,包括如下步骤:步骤1,构建基于深度卷积生成对抗网络的音频关键词识别模型;步骤2,训练基于深度卷积生成对抗网络的音频关键词识别模型;步骤3,利用训练好的基于深度卷积生成对抗网络的音频关键词识别模型进行音频关键词识别。本发明能够处理连续音频,并且不需要将音频转录为文本,而是直接对音频进行分析实现音频识别关键词。
基本信息
专利标题 :
一种基于深度卷积生成对抗网络的音频关键词识别方法
专利标题(英):
暂无
公开(公告)号 :
CN111724770A
申请号 :
CN202010425087.2
公开(公告)日 :
2020-09-29
申请日 :
2020-05-19
授权号 :
CN111724770B
授权日 :
2022-04-01
发明人 :
白杨李全兵詹茂豪徐海森
申请人 :
中国电子科技网络信息安全有限公司
申请人地址 :
四川省成都市双流区西南航空港经济开发区工业集中区内
代理机构 :
成都九鼎天元知识产权代理有限公司
代理人 :
钱成岑
优先权 :
CN202010425087.2
主分类号 :
G10L15/08
IPC分类号 :
G10L15/08 G10L15/26 G10L25/18 G10L25/24 G10L25/30 G06N3/04 G06N3/08
相关图片
IPC结构图谱
G
G部——物理
G10
乐器;声学
G10L
语音分析或合成;语音识别;语音或声音处理;语音或音频编码或解码
G10L15/00
语音识别
G10L15/08
语音分类或检索
法律状态
2022-04-01 :
授权
2020-10-27 :
实质审查的生效
IPC(主分类) : G10L 15/08
申请日 : 20200519
申请日 : 20200519
2020-09-29 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
1、
CN111724770A.PDF
PDF下载