基于生成对抗网络的频带扩展方法、编解码方法及系统
实质审查的生效
摘要
本申请公开了一种基于生成对抗网络的频带扩展方法、编解码方法及系统,属于音频编解码技术领域,该方法包括:在音频编码或解码过程中,通过LC3音频编码器或解码器对输入的音频数据进行特征提取,确定其对应的谱系数;对谱系数进行带宽检测,得到带宽指示;若带宽指示为窄带宽,则通过预训练的生成神经网络对窄带宽对应的低频谱系数进行扩展,得到高频谱系数;将低频谱系数和高频谱系数组合,得到宽带谱系数。本申请在音频编码或解码过程中,利用LC3编解码器中已有的模块获取音频数据的谱系数,并通过神经网络生成最终的宽带谱系数,完成频带的扩展。在编码或解码过程中完成频带扩展,节省算力,降低功耗,适用低功耗蓝牙,保证频带扩展的准确性。
基本信息
专利标题 :
基于生成对抗网络的频带扩展方法、编解码方法及系统
专利标题(英):
暂无
公开(公告)号 :
CN114420140A
申请号 :
CN202210322549.7
公开(公告)日 :
2022-04-29
申请日 :
2022-03-30
授权号 :
暂无
授权日 :
暂无
发明人 :
李强朱勇叶东翔王尧
申请人 :
北京百瑞互联技术有限公司
申请人地址 :
北京市海淀区上地三街9号A座9层A1009
代理机构 :
北京国科程知识产权代理事务所(普通合伙)
代理人 :
曹晓斐
优先权 :
CN202210322549.7
主分类号 :
G10L19/02
IPC分类号 :
G10L19/02 G10L19/16 G10L25/30 G06N3/04 G06N3/08
IPC结构图谱
G
G部——物理
G10
乐器;声学
G10L
语音分析或合成;语音识别;语音或声音处理;语音或音频编码或解码
G10L19/00
用于冗余度下降情形的语音或音频信号分析-合成技术;语音或音频信号编码或解码,采用源滤波器模型或心理声学分析
G10L19/02
利用频谱分析,例如变换声码器或子频带声码器
法律状态
2022-05-20 :
实质审查的生效
IPC(主分类) : G10L 19/02
申请日 : 20220330
申请日 : 20220330
2022-04-29 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载