一种利用半自回归融合领域术语的低资源机器翻译方法
实质审查的生效
摘要

本发明涉及一种利用半自回归融合领域术语的低资源机器翻译方法,属于自然语言处理机器翻译技术领域。本发明通过融合特定领域术语的低资源机器翻译方法,使用外部知识引导解码器,结合自回归与非自回归的解码方式,在引入先验知识的同时不牺牲解码效率,满足垂直领域的翻译需求。在半自回归的解码器中,将待生成的译文序列进行多组分块,块内采用自回归方式,块外采用非自回归方式。在推理阶段,分别通过删除历史译文中错误的词、插入先验知识术语约束词、预测合理的译文词并保留机制,从额外提供的约束中提取信息,进而融合外部先验知识。本发明不仅能够灵活融入外部先验知识,适应多领域不同翻译模型,相比自回归翻译方式大幅度提升了解码速率。

基本信息
专利标题 :
一种利用半自回归融合领域术语的低资源机器翻译方法
专利标题(英):
暂无
公开(公告)号 :
CN114492468A
申请号 :
CN202111385350.0
公开(公告)日 :
2022-05-13
申请日 :
2021-11-22
授权号 :
暂无
授权日 :
暂无
发明人 :
冯冲许达沙九
申请人 :
北京理工大学
申请人地址 :
北京市海淀区中关村南大街5号
代理机构 :
北京正阳理工知识产权代理事务所(普通合伙)
代理人 :
王松
优先权 :
CN202111385350.0
主分类号 :
G06F40/58
IPC分类号 :
G06F40/58  G06K9/62  G06N20/00  G06F40/30  
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06F
电数字数据处理
G06F40/58
使用机器翻译,例如用于多语言检索,用于客户端设备的服务器端翻译或实时翻译。
法律状态
2022-05-31 :
实质审查的生效
IPC(主分类) : G06F 40/58
申请日 : 20211122
2022-05-13 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332