一种语音增强方法
公开
摘要

本发明涉及一种语音增强方法,该方法包括:获取目标视频,目标视频包括:目标视频中所有声音的第一语音信号、目标人物的用作参考的第二语音信号和目标人物的图像;基于第一语音信号和第二语音信号,分别对第一语音信号和第二语音信号处理以得到第一语音频域信号和第二语音频域信号,并通过计算分别得到第一语音频域信号和第二语音频域信号所分别对应的幅度谱以及相位谱;基于目标视频,对目标人物出现的图像序列帧进行处理以得到包含目标人物的待处理图像,并对待处理图像进行处理以得到目标图像,可以有效的提升对视频中目标人物的面部动作的追踪,防止漏掉重要的面部信息,实现对目标视频中的目标人物的语音增强。

基本信息
专利标题 :
一种语音增强方法
专利标题(英):
暂无
公开(公告)号 :
CN114581832A
申请号 :
CN202210214364.4
公开(公告)日 :
2022-06-03
申请日 :
2022-03-04
授权号 :
暂无
授权日 :
暂无
发明人 :
李军锋王洋洋颜永红
申请人 :
中国科学院声学研究所
申请人地址 :
北京市海淀区北四环西路21号
代理机构 :
北京亿腾知识产权代理事务所(普通合伙)
代理人 :
陈霁
优先权 :
CN202210214364.4
主分类号 :
G06V20/40
IPC分类号 :
G06V20/40  G06V40/16  G06V10/82  G06N3/04  G10L21/02  G10L25/03  G10L25/27  G10L25/57  
法律状态
2022-06-03 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332