翻译模型训练方法、装置、设备及存储介质
公开
摘要
本公开涉及一种翻译模型训练方法、装置、设备及存储介质。本公开通过源语言文本和翻译词典,生成目标语言文本,当该目标语言文本中存在未出现于翻译词典中的预设文本单元时,可以将该目标语言文本中未出现在翻译词典中的预设文本单元替换为目标文本单元,得到更新后的目标语言文本。根据源语言文本和更新后的目标语言文本,对翻译模型进行训练。因此,当源语言语句到目标语言语句的平行语料非常稀少时,通过源语言文本和翻译词典可以构建目标语言文本、以及对目标语言文本进行更新。通过源语言语句和更新后的目标语言文本即可对翻译模型进行训练。从而实现了基于零资源或低资源的机器翻译模型或机器翻译系统的训练方法。
基本信息
专利标题 :
翻译模型训练方法、装置、设备及存储介质
专利标题(英):
暂无
公开(公告)号 :
CN114626389A
申请号 :
CN202210071284.8
公开(公告)日 :
2022-06-14
申请日 :
2022-01-21
授权号 :
暂无
授权日 :
暂无
发明人 :
陈谦王雯
申请人 :
阿里巴巴(中国)有限公司
申请人地址 :
浙江省杭州市滨江区长河街道网商路699号4号楼5楼508室
代理机构 :
北京开阳星知识产权代理有限公司
代理人 :
张子青
优先权 :
CN202210071284.8
主分类号 :
G06F40/56
IPC分类号 :
G06F40/56 G06F40/58 G06F40/242
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06F
电数字数据处理
G06F40/56
自然语言生成
法律状态
2022-06-14 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载