一种应用于低码率下的多音频对象编解码方法

授权

摘要

本发明公开了一种应用于低码率下的多音频对象编解码方法，编码阶段本方法首先将输入的多个音频对象变换到频域；然后将频域的音频对象信号下混得到混合信号，并计算单个音频对象子带被细分后的边信息矩阵；其次利用卷积自编码器中的编码模块对边信息矩阵进行降维表达；最后将混合信号和降维后的边信息合成码流。解码阶段首先分解接收到的码流，得到下混信号和边信息；然后在卷积自编码器解码器网络中引入稠密连接模块从边信息的低维结构中重构原始高维的边信息数据，最后将重建的频域音频对象信号变换为时域信号。本发明可以在低码率下全面提升音频对象信号的解码质量，以满足用户对音频对象个性化控制的需求。

基本信息

专利标题：

一种应用于低码率下的多音频对象编解码方法

专利标题（英）：

暂无

公开（公告）号：

CN113096672A

申请号：

CN202110312781.8

公开（公告）日：

2021-07-09

申请日：

2021-03-24

授权号：

CN113096672B

授权日：

2022-06-14

发明人：

胡瑞敏吴玉林王晓晨胡晨昊柯善发张灵鲲刘文可

申请人：

武汉大学

申请人地址：

湖北省武汉市武昌区珞珈山武汉大学

代理机构：

武汉科皓知识产权代理事务所(特殊普通合伙)

代理人：

魏波

优先权：

CN202110312781.8

主分类号：

G10L19/02

IPC分类号：

G10L19/02 G10L19/032 G10L25/18 G10L25/30

IPC结构图谱

G部——物理

G10

乐器；声学

G10L

语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码

G10L19/00

用于冗余度下降情形的语音或音频信号分析-合成技术；语音或音频信号编码或解码，采用源滤波器模型或心理声学分析

G10L19/02

利用频谱分析，例如变换声码器或子频带声码器

法律状态

2022-06-14 ：

授权

2021-07-27 ：

实质审查的生效

IPC(主分类) : G10L 19/02
申请日 : 20210324

2021-07-09 ：

公开

注：本法律状态信息仅供参考，即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。

文件下载

暂无PDF文件可下载