音频信号处理方法、装置及电子设备
实质审查的生效
摘要

本申请实施例公开了音频信号处理方法、装置及电子设备,所述方法包括对多人发言场景下采集到的音频信号进行语音识别以及声源定位;其中,在对所述音频信号进行声源定位时:获取当前信号帧及其前后目标数量的信号帧的波达方向谱图信息组成矩阵谱图,并对所述矩阵谱图进行平滑处理;根据当前信号帧对应的平滑处理后的波达方向谱图中,满足目标条件的取值对应的角度,确定所述当前信号帧的声源定位结果;根据多个信号帧的声源定位结果确定发言人变更事件的发生位置,并根据所述发言人变更事件的发生位置将语音识别得到的文本进行分隔。通过本申请实施例,能够提高会议记录的效率以及准确度,降低会议记录工作人员的工作量。

基本信息
专利标题 :
音频信号处理方法、装置及电子设备
专利标题(英):
暂无
公开(公告)号 :
CN114387970A
申请号 :
CN202011133819.7
公开(公告)日 :
2022-04-22
申请日 :
2020-10-21
授权号 :
暂无
授权日 :
暂无
发明人 :
郑斯奇索宏彬
申请人 :
阿里巴巴集团控股有限公司
申请人地址 :
英属开曼群岛大开曼资本大厦一座四层847号邮箱
代理机构 :
北京众达德权知识产权代理有限公司
代理人 :
南海燕
优先权 :
CN202011133819.7
主分类号 :
G10L15/26
IPC分类号 :
G10L15/26  G06F40/289  G01S5/22  
IPC结构图谱
G
G部——物理
G10
乐器;声学
G10L
语音分析或合成;语音识别;语音或声音处理;语音或音频编码或解码
G10L15/00
语音识别
G10L15/26
语音—正文识别系统
法律状态
2022-05-10 :
实质审查的生效
IPC(主分类) : G10L 15/26
申请日 : 20201021
2022-04-22 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332