文本处理、数据处理和语音处理方法、装置和电子设备
授权
摘要
本公开实施例公开了文本处理、数据处理和语音处理方法、装置和电子设备,文本处理方法包括:通过根据待纠错文本包括第一语言元素,对含有第一语言元素的待纠错文本生成第一掩码,并且利用第一掩码对待纠错文本中的第一语言元素进行掩盖以生成替换文本;将第一掩码和替换文本输入纠错模型以预测与第一语言元素对应的第一语言元素向量;根据预测出的第一语言元素向量生成目标语言元素;利用所生成的目标语言元素替代待纠错文本中的第一语言元素以获得经纠错的文本,可以将待纠错文本的替换文本以及第一掩码输入纠错模型,生成第一语言元素以替代待纠错文本中的第一语言元素,从而提高对待纠错文本中的第一语言元素的识别准确率。
基本信息
专利标题 :
文本处理、数据处理和语音处理方法、装置和电子设备
专利标题(英):
暂无
公开(公告)号 :
CN113270088A
申请号 :
CN202010092098.3
公开(公告)日 :
2021-08-17
申请日 :
2020-02-14
授权号 :
CN113270088B
授权日 :
2022-04-29
发明人 :
包祖贻李辰黄非
申请人 :
阿里巴巴集团控股有限公司
申请人地址 :
英属开曼群岛大开曼资本大厦一座四层847号邮箱
代理机构 :
北京智信四方知识产权代理有限公司
代理人 :
宋海龙
优先权 :
CN202010092098.3
主分类号 :
G10L15/06
IPC分类号 :
G10L15/06 G10L15/10 G10L19/012 G06F40/221 G06F40/232
IPC结构图谱
G
G部——物理
G10
乐器;声学
G10L
语音分析或合成;语音识别;语音或声音处理;语音或音频编码或解码
G10L15/00
语音识别
G10L15/06
创建基准模板;训练语音识别系统,例如对说话者声音特征的适应
法律状态
2022-04-29 :
授权
2021-09-03 :
实质审查的生效
IPC(主分类) : G10L 15/06
申请日 : 20200214
申请日 : 20200214
2021-08-17 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载