音频信号处理方法、装置、设备及存储介质
授权
摘要
本公开涉及一种音频信号处理方法、装置、设备及存储介质。本公开通过对音频信号进行分段处理得到多个音频分段,根据多个音频分段中每个音频分段的特征信息,对多个音频分段进行聚类处理,得到一个或多个第一集合。进一步,根据每个第一集合包括的音频分段的特征信息,确定每个第一集合的第一聚类中心,并且根据每个第一集合的第一聚类中心,对多个音频分段进行聚类处理,得到一个或多个第二集合,其中,同一个第二集合中的音频分段对应相同的角色标签。也就是说,在对多个音频分段进行初始聚类处理后,还可以根据每个第一集合的第一聚类中心,对多个音频分段进行再次聚类处理,从而提高了基于单通道语音的无监督角色分离的准确性。
基本信息
专利标题 :
音频信号处理方法、装置、设备及存储介质
专利标题(英):
暂无
公开(公告)号 :
CN113808578A
申请号 :
CN202111351380.X
公开(公告)日 :
2021-12-17
申请日 :
2021-11-16
授权号 :
CN113808578B
授权日 :
2022-04-15
发明人 :
王宪亮索宏彬
申请人 :
阿里巴巴达摩院(杭州)科技有限公司
申请人地址 :
浙江省杭州市余杭区五常街道文一西路969号3幢5层516室
代理机构 :
北京开阳星知识产权代理有限公司
代理人 :
张子青
优先权 :
CN202111351380.X
主分类号 :
G10L15/02
IPC分类号 :
G10L15/02 G10L15/04 G10L15/08 G10L15/16
相关图片
IPC结构图谱
G
G部——物理
G10
乐器;声学
G10L
语音分析或合成;语音识别;语音或声音处理;语音或音频编码或解码
G10L15/00
语音识别
G10L15/02
语音识别的特征提取;识别单位的选择
法律状态
2022-04-15 :
授权
2022-01-04 :
实质审查的生效
IPC(主分类) : G10L 15/02
申请日 : 20211116
申请日 : 20211116
2021-12-17 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
1、
CN113808578A.PDF
PDF下载