增强词汇一致性的神经机器翻译方法、设备和存储介质
实质审查的生效
摘要
本公开提供一种增强词汇一致性的神经机器翻译方法,包括:通过训练获得标准的句子级Transformer翻译模型,获得初始化“目标端‑源端”注意力权重;对于输入Transformer翻译模型的篇章,抽取语义上下文向量和一致性上下文向量;利用一致性上下文向量对篇章中每组重复的源端单词生成对应的唯一的一致性概率分布;利用一致性上下文向量和语义上下文向量,评估源端重复单词需要被翻译一致的置信度;在Transformer翻译模型解码时刻借助注意力权重计算当前解码时刻最终的词表预测概率分布。本公开还包括对应的增强词汇一致性的神经机器电子设备和可读存储介质。
基本信息
专利标题 :
增强词汇一致性的神经机器翻译方法、设备和存储介质
专利标题(英):
暂无
公开(公告)号 :
CN114462434A
申请号 :
CN202111582619.4
公开(公告)日 :
2022-05-10
申请日 :
2021-12-22
授权号 :
暂无
授权日 :
暂无
发明人 :
周玉亢晓勉
申请人 :
北京中科凡语科技有限公司
申请人地址 :
北京市海淀区知春路63号51号楼10层1006
代理机构 :
北京庚致知识产权代理事务所(特殊普通合伙)
代理人 :
韩德凯
优先权 :
CN202111582619.4
主分类号 :
G06F40/58
IPC分类号 :
G06F40/58 G06F40/211 G06F40/30 G06F16/35 G06N3/04 G06N3/08
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06F
电数字数据处理
G06F40/58
使用机器翻译,例如用于多语言检索,用于客户端设备的服务器端翻译或实时翻译。
法律状态
2022-05-27 :
实质审查的生效
IPC(主分类) : G06F 40/58
申请日 : 20211222
申请日 : 20211222
2022-05-10 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载