一种说话人标签对齐方法、装置、电子设备及计算机可读存储介...
实质审查的生效
摘要
本发明的实施例提供了一种说话人标签对齐方法、装置、电子设备及计算机可读存储介质,方法包括:获取N个声道的N个说话人日志,分别对每个说话人日志进行聚类,得到聚类后的N个说话人标签集,将第一目标说话人标签集作为参考标签集,基于参考标签集,将除第一目标说话人标签集以外的N‑1个第二目标说话人标签集进行对齐处理。能够将多通道的说话人日志所对应的说话人标签进行对齐,从而使得多个通道的说话人日志对应的说话人标签集不再是相对标签,而是绝对标签,进一步提升说话人日志的准确率。
基本信息
专利标题 :
一种说话人标签对齐方法、装置、电子设备及计算机可读存储介质
专利标题(英):
暂无
公开(公告)号 :
CN114464209A
申请号 :
CN202210125317.2
公开(公告)日 :
2022-05-10
申请日 :
2022-02-10
授权号 :
暂无
授权日 :
暂无
发明人 :
吕翔印晶晶卢恒
申请人 :
上海喜马拉雅科技有限公司
申请人地址 :
上海市闵行区紫星路588号2幢2062室
代理机构 :
北京超凡宏宇专利代理事务所(特殊普通合伙)
代理人 :
杜杨
优先权 :
CN202210125317.2
主分类号 :
G10L25/03
IPC分类号 :
G10L25/03 G10L17/06 G10L17/00 G10L15/28 G06K9/62 G06F17/16
IPC结构图谱
G
G部——物理
G10
乐器;声学
G10L
语音分析或合成;语音识别;语音或声音处理;语音或音频编码或解码
G10L25/00
不限于组G10L 15/00-G10L 21/00的语言或者声音分析技术
G10L25/03
以提取参数类型为特征的
法律状态
2022-05-27 :
实质审查的生效
IPC(主分类) : G10L 25/03
申请日 : 20220210
申请日 : 20220210
2022-05-10 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载