联合语气词特征的视音频驱动人脸动画实现方法及系统

授权

摘要

一种联合语气词特征的视音频驱动人脸动画方法及系统，通过提取语音特征构建出语音特征矩阵，利用语气词增强训练网络的多层卷积操作对特征矩阵进行采样并映射到低维空间的中间变量；对输入的语音转换成文字，从文字内容中识别出语气词并构建one‑hot向量，与中间变量拼接后得到包含语气词特征的中间变量；再通过语气词增强训练网络进行卷积后映射为当前帧的表情AU参数，用于与视频追踪、语音预测算法生成的AU参数拟合后作为人脸模型的驱动参数，实现表情增强。本发明通过输入用户面部的视频内容和用户发声的音频内容，就可以联合驱动虚拟场景中的三维Avatar模型，在实时驱动的基础上，使整体和局部的面部动画都得到较为逼真和生动的表现效果。

基本信息

专利标题：

联合语气词特征的视音频驱动人脸动画实现方法及系统

专利标题（英）：

暂无

公开（公告）号：

CN112614212A

申请号：

CN202011484986.6

公开（公告）日：

2021-04-06

申请日：

2020-12-16

授权号：

CN112614212B

授权日：

2022-05-17

发明人：

李舜肖双九

申请人：

上海交通大学

申请人地址：

上海市闵行区东川路800号

代理机构：

上海交达专利事务所

代理人：

王毓理

优先权：

CN202011484986.6

主分类号：

G06T13/20

IPC分类号：

G06T13/20 G06T13/40 G06K9/00 G06F40/284 G10L15/26 G10L25/30

IPC结构图谱

G部——物理

G06

计算；推算或计数

G06T

一般的图像数据处理或产生

G06T13/00

动画制作

G06T13/20

3D动画

法律状态

2022-05-17 ：

授权

2021-04-23 ：

实质审查的生效

IPC(主分类) : G06T 13/20
申请日 : 20201216

2021-04-06 ：

公开

注：本法律状态信息仅供参考，即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。

文件下载

暂无PDF文件可下载