在生成对抗中获得更好的语音翻译模型的训练方法和系统
授权
摘要
本发明提供一种在生成对抗中获得更好的语音翻译模型的训练方法和系统。该方法包括收集训练数据,利用训练数据中的转录‑翻译数据对训练MT模型;利用收缩机制对ST模型的输入长度进行压缩,使得语音和文本的编码层输出长度近似相同,包括:先采用CTC损失帮助ST模型预测语音的转录,捕捉语音的声学信息;然后利用CTC存在的峰值现象去除ST模型编码层状态中的冗余信息;采用对抗器通过“最大最小”的方法,使ST模型的编码层输出分布拟合MT模型的编码层输出分布,帮助ST模型捕捉到更多的语义信息;以CTC损失作为附加损失,结合端到端ST模型的损失对整个语音翻译模型进行联合训练。本发明能提升语音翻译模型的识别性能,进而提高语音翻译效率和质量。
基本信息
专利标题 :
在生成对抗中获得更好的语音翻译模型的训练方法和系统
专利标题(英):
暂无
公开(公告)号 :
CN113505611A
申请号 :
CN202110780410.2
公开(公告)日 :
2021-10-15
申请日 :
2021-07-09
授权号 :
CN113505611B
授权日 :
2022-04-15
发明人 :
屈丹张昊杨绪魁闫红刚张文林郝朝龙魏雪娟李真
申请人 :
中国人民解放军战略支援部队信息工程大学;郑州信大先进技术研究院
申请人地址 :
河南省郑州市高新区科学大道62号
代理机构 :
郑州大通专利商标代理有限公司
代理人 :
张立强
优先权 :
CN202110780410.2
主分类号 :
G06F40/58
IPC分类号 :
G06F40/58 G06F40/30 G10L15/26 G06K9/62 G06N3/04 G06N3/08
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06F
电数字数据处理
G06F40/58
使用机器翻译,例如用于多语言检索,用于客户端设备的服务器端翻译或实时翻译。
法律状态
2022-04-15 :
授权
2021-11-02 :
实质审查的生效
IPC(主分类) : G06F 40/58
申请日 : 20210709
申请日 : 20210709
2021-10-15 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载