实时语音识别方法、模型训练方法、装置及设备

公开

摘要

本申请公开了一种实时语音识别方法、模型训练方法、装置及设备，涉及人工智能技术领域。本申请实施例可用于人工智能、智慧交通、辅助驾驶等各种场景。所述方法包括：获取目标语音数据的待识别块的音频特征序列；复用待识别块的历史块的处理结果，对待识别块的音频特征序列进行编码处理，得到待识别块的隐层特征序列；其中，历史块是指与待识别块具有至少一个重叠的帧，且已经过编码处理的块；根据隐层特征序列，解码得到待识别块的语音识别结果。本申请减少了编码处理过程的计算量，加快了语音识别的速度，从而更好地满足实时语音识别的需求。

基本信息

专利标题：

实时语音识别方法、模型训练方法、装置及设备

专利标题（英）：

暂无

公开（公告）号：

CN114596841A

申请号：

CN202210253123.0

公开（公告）日：

2022-06-07

申请日：

2022-03-15

授权号：

暂无

授权日：

暂无

发明人：

刘晶晶张弼弘

申请人：

腾讯科技（深圳）有限公司

申请人地址：

广东省深圳市南山区高新区科技中一路腾讯大厦35层

代理机构：

北京三高永信知识产权代理有限责任公司

代理人：

李文静

优先权：

CN202210253123.0

主分类号：

G10L15/02

IPC分类号：

G10L15/02 G10L15/04 G10L15/06 G10L19/16

IPC结构图谱

G部——物理

G10

乐器；声学

G10L

语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码

G10L15/00

语音识别

G10L15/02

语音识别的特征提取；识别单位的选择

法律状态

2022-06-07 ：

公开

注：本法律状态信息仅供参考，即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。

文件下载

暂无PDF文件可下载