一种模拟虚拟人物说话的方法及装置

实质审查的生效

摘要

本发明实施例公开了一种模拟虚拟人物说话的方法及装置，方法包括以下步骤：根据多个音素分类，制作与每个音素分类对应的口型，得到多个基础口型；输入音频流，提取音频流的音频帧，识别音频帧的音素；从多个音素分类中，确定与音频帧的音素对应的音素分类，选择与之对应的基础口型；将选择的基础口型合成音频帧的对应口型。将真人口型通过音素分类，整理为14个基本口型，可以让计算机通过音素识别，驱动虚拟数字人口型同步。通过虚拟数字人口型专利，可以快速准确的实现虚拟数字人的语音口型同步。制定了口型标准化口型制作方案，极大的提高了虚拟数字人口型制作效率和口型的质量。让虚拟数字人更加接近于真人，极大的提升了用户的体验。

基本信息

专利标题：

一种模拟虚拟人物说话的方法及装置

专利标题（英）：

暂无

公开（公告）号：

CN114359450A

申请号：

CN202210050718.6

公开（公告）日：

2022-04-15

申请日：

2022-01-17

授权号：

暂无

授权日：

暂无

发明人：

余国军耿俊怀

申请人：

小哆智能科技（北京）有限公司

申请人地址：

北京市海淀区西北旺东路10号院东区23号楼三层346室

代理机构：

北京知呱呱知识产权代理有限公司

代理人：

朱芳

优先权：

CN202210050718.6

主分类号：

G06T13/40

IPC分类号：

G06T13/40 G10L15/00 G10L15/02 G10L15/08

IPC结构图谱

G部——物理

G06

计算；推算或计数

G06T

一般的图像数据处理或产生

G06T13/00

动画制作

G06T13/20

3D动画

G06T13/40

关于角色的，例如：人类、动物或虚幻人物

法律状态

2022-05-03 ：

实质审查的生效

IPC(主分类) : G06T 13/40
申请日 : 20220117

2022-04-15 ：

公开

注：本法律状态信息仅供参考，即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。

文件下载

暂无PDF文件可下载