用于生成说话人像视频和训练人脸渲染模型的方法、装置

公开

摘要

本公开的实施例公开了用于生成说话人像视频和用于训练人脸渲染模型的方法、装置。该方法的一具体实施方式包括：将预先获取的语音的音频特征序列输入至预先训练的口型生成模型，生成与该语音对应的口型特征序列；将该口型特征序列输入至基于预先获取的目标人像训练得到的人脸渲染模型，生成利用该语音操控该目标人像的说话人像视频，其中，该人脸渲染模型中包括第一解码器，该第一解码器用于表征人像特征与说话人像之间的对应关系，该人像特征包括预设表情特征和该口型特征序列中的口型特征。该实施方式实现了表情人为可控的说话人像视频的生成。

基本信息

专利标题：

用于生成说话人像视频和训练人脸渲染模型的方法、装置

专利标题（英）：

暂无

公开（公告）号：

CN114581980A

申请号：

CN202210201928.0

公开（公告）日：

2022-06-03

申请日：

2022-03-03

授权号：

暂无

授权日：

暂无

发明人：

刘颖璐马致远石海林梅涛周伯文

申请人：

北京京东尚科信息技术有限公司

申请人地址：

北京市海淀区知春路76号8层

代理机构：

北京英赛嘉华知识产权代理有限责任公司

代理人：

王达佐

优先权：

CN202210201928.0

主分类号：

G06V40/16

IPC分类号：

G06V40/16 G06V20/40 G06V10/75 G06V10/774 G06K9/62 G10L25/57

法律状态

2022-06-03 ：

公开

注：本法律状态信息仅供参考，即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。

文件下载

暂无PDF文件可下载