说话人计数方法及系统
授权
摘要

本发明实施例提供一种说话人计数方法。该方法包括:基于深度卷积神经网络建立端到端说话人计数模型;将原始音频波形作为所述端到端说话人计数模型的输入;根据所述端到端说话人计数模型的输出结果确定说话人个数。本发明实施例提供说话人计数系统并且还提供了一种混叠语音检测模型的优化方法及系统。本发明实施例采用原始波形输入的端到端语音混叠检测与说话人计数方法,利用神经网络直接从原始语音中提取深度特征用于后续任务,更容易得到匹配相应任务的特征,准确的确定出说话人的个数;更适用于实际生活中多人同时说话的场景,为后端语音处理系统提供额外信息,从而推进混叠语音的识别、分离、增强的问题。

基本信息
专利标题 :
说话人计数方法及系统
专利标题(英):
暂无
公开(公告)号 :
CN110569908A
申请号 :
CN201910854260.8
公开(公告)日 :
2019-12-13
申请日 :
2019-09-10
授权号 :
CN110569908B
授权日 :
2022-05-13
发明人 :
钱彦旻张王优孙曼王岚
申请人 :
苏州思必驰信息科技有限公司;上海交通大学
申请人地址 :
江苏省苏州市苏州工业园区新平街388号腾飞创新园14栋
代理机构 :
北京商专永信知识产权代理事务所(普通合伙)
代理人 :
黄谦
优先权 :
CN201910854260.8
主分类号 :
G06K9/62
IPC分类号 :
G06K9/62  G06N3/04  G10L25/30  G10L25/51  
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06K
数据识别;数据表示;记录载体;记录载体的处理
G06K9/00
用于阅读或识别印刷或书写字符或者用于识别图形,例如,指纹的方法或装置
G06K9/62
应用电子设备进行识别的方法或装置
法律状态
2022-05-13 :
授权
2021-05-18 :
著录事项变更
IPC(主分类) : G06K 9/62
变更事项 : 申请人
变更前 : 苏州思必驰信息科技有限公司
变更后 : 思必驰科技股份有限公司
变更事项 : 地址
变更前 : 215123 江苏省苏州市苏州工业园区新平街388号腾飞创新园14栋
变更后 : 215123 江苏省苏州市苏州工业园区新平街388号腾飞创新园14栋
2020-11-03 :
专利申请权、专利权的转移
专利申请权的转移IPC(主分类) : G06K 9/62
登记生效日 : 20201022
变更事项 : 申请人
变更前权利人 : 苏州思必驰信息科技有限公司
变更后权利人 : 苏州思必驰信息科技有限公司
变更事项 : 地址
变更前权利人 : 215123 江苏省苏州市苏州工业园区新平街388号腾飞创新园14栋
变更后权利人 : 215123 江苏省苏州市苏州工业园区新平街388号腾飞创新园14栋
变更事项 : 申请人
变更前权利人 : 上海交大知识产权管理有限公司
2020-07-07 :
专利申请权、专利权的转移
专利申请权的转移IPC(主分类) : G06K 9/62
登记生效日 : 20200617
变更事项 : 申请人
变更前权利人 : 苏州思必驰信息科技有限公司
变更后权利人 : 苏州思必驰信息科技有限公司
变更事项 : 地址
变更前权利人 : 215123 江苏省苏州市苏州工业园区新平街388号腾飞创新园14栋
变更后权利人 : 215123 江苏省苏州市苏州工业园区新平街388号腾飞创新园14栋
变更事项 : 申请人
变更前权利人 : 上海交通大学
变更后权利人 : 上海交大知识产权管理有限公司
2020-01-07 :
实质审查的生效
IPC(主分类) : G06K 9/62
申请日 : 20190910
2019-12-13 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332