自监督音高估计
实质审查的生效
摘要

示例实施例涉及用于训练人工神经网络或其它机器学习编码器以准确预测半音或以其它方式对数标度的音高空间中的输入音频样本的音高的技术。示例方法可以包括通过将两个不同的音高位移应用于音频训练数据的样本,从该音频数据的样本生成两个训练样本。这可以通过将该音频数据的样本转换到频域然后使转换后的数据移位来完成。然后将这些已知的位移与通过将所述两个训练样本应用于编码器而生成的预测音高进行比较。然后基于比较来更新编码器,使得由编码器输出的相对音高在准确性方面得到改善。然后可以使用一个或更多个用绝对音高值标记的音频样本来校准训练过的编码器所生成的相对音高值。

基本信息
专利标题 :
自监督音高估计
专利标题(英):
暂无
公开(公告)号 :
CN114556473A
申请号 :
CN202080072283.4
公开(公告)日 :
2022-05-27
申请日 :
2020-09-25
授权号 :
暂无
授权日 :
暂无
发明人 :
M.塔吉利亚萨奇M.韦尔米罗维奇M.沙里菲D.罗布雷克C.弗兰克B.格费尔勒
申请人 :
谷歌有限责任公司
申请人地址 :
美国加利福尼亚州
代理机构 :
北京市柳沈律师事务所
代理人 :
金玉洁
优先权 :
CN202080072283.4
主分类号 :
G10L25/60
IPC分类号 :
G10L25/60  G10L25/30  G10L25/90  
IPC结构图谱
G
G部——物理
G10
乐器;声学
G10L
语音分析或合成;语音识别;语音或声音处理;语音或音频编码或解码
G10L25/00
不限于组G10L 15/00-G10L 21/00的语言或者声音分析技术
G10L25/48
专门适用于特定用途
G10L25/51
比较或判别
G10L25/60
语音信号的质量检测
法律状态
2022-06-14 :
实质审查的生效
IPC(主分类) : G10L 25/60
申请日 : 20200925
2022-05-27 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332