一种字幕生成方法、装置及设备

公开

摘要

本申请实施例提供了一种字幕生成方法、装置及设备，将获取的语音数据转化为文本数据。将满足第一预设条件的文本数据确定为预选噪声文本数据。获取预选噪声文本数据对应的预选噪声语音数据，并确定预选噪声语音数据中的人声数据。当人声数据满足第二预设条件时，确定预选噪声语音数据为非噪声语音数据。将非噪声语音数据对应的文本数据作为字幕进行输出。如此，能够基于已经去噪处理的语音数据所生成的文本数据，进行第二次去噪处理，提高了噪声字幕的过滤能力，使得展示的字幕更加准确。

基本信息

专利标题：

一种字幕生成方法、装置及设备

专利标题（英）：

暂无

公开（公告）号：

CN114299950A

申请号：

CN202111668821.9

公开（公告）日：

2022-04-08

申请日：

2021-12-30

授权号：

暂无

授权日：

暂无

发明人：

尹君豪姚佳立杨晶生

申请人：

北京字跳网络技术有限公司

申请人地址：

北京市海淀区紫金数码园4号楼2层0207

代理机构：

北京信远达知识产权代理有限公司

代理人：

贾小慧

优先权：

CN202111668821.9

主分类号：

G10L15/22

IPC分类号：

G10L15/22 G10L15/20 G10L15/26

IPC结构图谱

G部——物理

G10

乐器；声学

G10L

语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码

G10L15/00

语音识别

G10L15/22

在语音识别过程中使用的程序

法律状态

2022-04-08 ：

公开

注：本法律状态信息仅供参考，即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。

文件下载

暂无PDF文件可下载