一种文本顺滑方法、系统和计算机设备
公开
摘要
本发明涉及一种文本顺滑方法、系统和计算机设备,属于语音识别技术领域;解决了现有技术中语音转写口语文本的顺滑方法无法满足复杂场景的需求,且生成的顺滑后的文本忠诚度和流畅度不高的问题;本发明的文本顺滑方法包括:通过构造包含伪标签的不顺滑语料对和构造不包含标签的扩充语料对样本进行扩充,得到扩充后的训练样本集合;利用训练样本集合对多任务神经网络模型进行训练,并使用损失函数进行梯度更新,得到文本顺滑模型;利用文本顺滑模型识别待顺滑文本得到顺滑后的文本。本发明通过一个网络进行多任务建模,实现了不流畅文本检测,同时输出顺滑后的文本,提高了口语文本的可阅读性,识别文本更加人性化。
基本信息
专利标题 :
一种文本顺滑方法、系统和计算机设备
专利标题(英):
暂无
公开(公告)号 :
CN114611492A
申请号 :
CN202210262908.4
公开(公告)日 :
2022-06-10
申请日 :
2022-03-17
授权号 :
暂无
授权日 :
暂无
发明人 :
陈玮冯少辉张建业
申请人 :
北京中科智加科技有限公司
申请人地址 :
北京市海淀区学院路51号10层1010、1011室
代理机构 :
北京天达知识产权代理事务所(普通合伙)
代理人 :
庞许倩
优先权 :
CN202210262908.4
主分类号 :
G06F40/216
IPC分类号 :
G06F40/216 G06F40/30 G06F40/284 G06F40/289 G06F40/247 G06K9/62 G06N3/04 G06N3/08 G10L15/26
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06F
电数字数据处理
G06F40/216
使用统计方法
法律状态
2022-06-10 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载