基于动态时间规划根据语音信息合成舌超声视频的方法
授权
摘要
本发明涉及语音与图像合成技术领域,为获得连贯自然且较为清晰的舌超声运动图像。为此,本发明采取的技术方案是,基于动态时间规划根据语音信息合成舌超声视频的方法,首先基于语音识别技术识别输入的语音文字,之后根据共振峰能量根据识别结果按独立发音切割语音段,通过动态时间规划的方法,将输入语音中每个字的舌运动图像自语音‑超声图像库中选择出来,在单词拼接过程中使用全连接神经网络自编码器提取特征值进行插值,最终合成出连贯的舌超声图像。本发明主要应用于超声视频图像处理场合。
基本信息
专利标题 :
基于动态时间规划根据语音信息合成舌超声视频的方法
专利标题(英):
暂无
公开(公告)号 :
CN110428812A
申请号 :
CN201910696959.6
公开(公告)日 :
2019-11-08
申请日 :
2019-07-30
授权号 :
CN110428812B
授权日 :
2022-04-05
发明人 :
燕昭吕绪康路文焕何宇清
申请人 :
天津大学
申请人地址 :
天津市南开区卫津路92号
代理机构 :
天津市北洋有限责任专利代理事务所
代理人 :
刘国威
优先权 :
CN201910696959.6
主分类号 :
G10L15/04
IPC分类号 :
G10L15/04 G10L15/08 G10L15/26 G10L19/02 G10L21/10 G10L25/15 G10L25/24 G10L25/30
IPC结构图谱
G
G部——物理
G10
乐器;声学
G10L
语音分析或合成;语音识别;语音或声音处理;语音或音频编码或解码
G10L15/00
语音识别
G10L15/04
分段;字极限检测
法律状态
2022-04-05 :
授权
2019-12-03 :
实质审查的生效
IPC(主分类) : G10L 15/04
申请日 : 20190730
申请日 : 20190730
2019-11-08 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载