一种声音驱动虚拟形象口型方法、装置及介质

公开

摘要

本申请公开了一种声音驱动虚拟形象口型方法、装置及介质，涉及人工智能领域。通过获取由音频采集设备采集的目标语音，获取其中的声韵母或音标及其对应的持续时间，并获取对应的语音波形包络的幅度值；根据持续时间和幅度值获取基本发音口型模型在预设频率下的时序数据；基本发音口型模型为通过不同的声韵母或不同的音标的口型下对应的语音波形包络的幅度值生成的模型；将时序数据输入至基本发音口型模型，得到与目标语音时间同步的目标口型。上述方案通过采集语音并识别音频中每个词的发音及其对应的时间段，结合声音波形输出连续的时序数据至预先生成的基本发音口型模型中以得到目标口型，使得虚拟人物的口型和声音同步，同步效率高且成本低。

基本信息

专利标题：

一种声音驱动虚拟形象口型方法、装置及介质

专利标题（英）：

暂无

公开（公告）号：

CN114581567A

申请号：

CN202210483379.0

公开（公告）日：

2022-06-03

申请日：

2022-05-06

授权号：

暂无

授权日：

暂无

发明人：

唐浩

申请人：

成都市谛视无限科技有限公司

申请人地址：

四川省成都市自由贸易试验区成都高新区剑南大道中段716号1栋27层04、05号

代理机构：

北京集佳知识产权代理有限公司

代理人：

鲁梅

优先权：

CN202210483379.0

主分类号：

G06T13/20

IPC分类号：

G06T13/20 G06T13/40 G06N3/08

IPC结构图谱

G部——物理

G06

计算；推算或计数

G06T

一般的图像数据处理或产生

G06T13/00

动画制作

G06T13/20

3D动画

法律状态

2022-06-03 ：

公开

注：本法律状态信息仅供参考，即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。

文件下载

暂无PDF文件可下载