音频信号处理方法、装置及电子设备
实质审查的生效
摘要
本申请实施例公开了音频信号处理方法、装置及电子设备,所述方法包括:对多人发言场景下采集到的音频信号进行语音识别、声源定位以及语音端点检测;根据声源定位结果确定所述音频信号中的发言人变更时间点,所述发言人变更时间点包括:所述音频信号中发言人变更事件时刻在时间轴上的位置;根据语音端点检测结果中语音端点在时间轴上的位置,对所述发言人变更时间点进行修正;根据修正后的发言人变更时间点,将语音识别得到的文本进行分隔,得到多个文本段。通过本申请实施例,能够提高会议记录的效率以及准确度,降低会议记录工作人员的工作量。
基本信息
专利标题 :
音频信号处理方法、装置及电子设备
专利标题(英):
暂无
公开(公告)号 :
CN114387956A
申请号 :
CN202011135534.7
公开(公告)日 :
2022-04-22
申请日 :
2020-10-21
授权号 :
暂无
授权日 :
暂无
发明人 :
郑斯奇索宏彬王宪亮
申请人 :
阿里巴巴集团控股有限公司
申请人地址 :
英属开曼群岛大开曼资本大厦一座四层847号邮箱
代理机构 :
北京众达德权知识产权代理有限公司
代理人 :
南海燕
优先权 :
CN202011135534.7
主分类号 :
G10L15/05
IPC分类号 :
G10L15/05 G10L15/26 G06F40/289 G01S5/22
IPC结构图谱
G
G部——物理
G10
乐器;声学
G10L
语音分析或合成;语音识别;语音或声音处理;语音或音频编码或解码
G10L15/00
语音识别
G10L15/04
分段;字极限检测
G10L15/05
字边界检测
法律状态
2022-05-10 :
实质审查的生效
IPC(主分类) : G10L 15/05
申请日 : 20201021
申请日 : 20201021
2022-04-22 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载