一种语音识别的口语文本生成方法
公开
摘要

本发明公开了一种语音识别的口语文本生成方法,包括步骤S1:进行端点检测获得声音信号并对声音信号进行初步去噪;步骤S2:通过语音识别引擎将去噪后的声音信号转换为机器语言;步骤S3:通过语音识别模型与分离模型对机器语言联合训练;步骤S4:进行后端识别处理;步骤S5:生成口语文本;本发明有效解决了目前口语生成文本不够准确的问题,相较于普通的口语文本生成方法具有高准确性;更接近于人的口语叙述方式,可辨别性高;具有多种口语文本的生成,可供使用者选择,选择度高;进行自我学习,语义识别随使用时间稳定性和准确度均有提高。

基本信息
专利标题 :
一种语音识别的口语文本生成方法
专利标题(英):
暂无
公开(公告)号 :
CN114627873A
申请号 :
CN202111333223.6
公开(公告)日 :
2022-06-14
申请日 :
2021-11-11
授权号 :
暂无
授权日 :
暂无
发明人 :
沈红峰方景辉陈超姚强龚利武张健潘白浪张炜施文杰万家建顾一星朱晓晨薛天琛陆夕蒙张嘉辉张桂玲黄悦华
申请人 :
国网浙江省电力有限公司平湖市供电公司;平湖市通用电气安装有限公司;国网浙江省电力有限公司嘉兴供电公司
申请人地址 :
浙江省嘉兴市平湖市当湖街道当湖东路352-396号
代理机构 :
杭州杭诚专利事务所有限公司
代理人 :
尉伟敏
优先权 :
CN202111333223.6
主分类号 :
G10L15/26
IPC分类号 :
G10L15/26  G10L15/06  G10L21/0208  
IPC结构图谱
G
G部——物理
G10
乐器;声学
G10L
语音分析或合成;语音识别;语音或声音处理;语音或音频编码或解码
G10L15/00
语音识别
G10L15/26
语音—正文识别系统
法律状态
2022-06-14 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332