基于动态词嵌入对齐的无监督泰语依存句法分析方法
公开
摘要
本发明涉及一种基于动态词嵌入对齐的无监督泰语依存句法分析方法,属于自然语言处理领域。本发明包括步骤:首先分别获取泰语和英语的单语动态词嵌入;然后针对泰语作为低资源语言缺乏双语平行语料,采用对抗训练的方式将泰语和英语的词向量进行对齐,从而构建新的词向量对应关系;最后针对泰语缺乏标注语料,借助泰语和英语间的映射矩阵将在英语依存标注树库上训练的Biaffine解析模型迁移到泰语,以此实现无监督泰语依存句法分析任务。与以往基于迁移学习的泰语依存句法分析方法相比,本发明既不需要平行语料、又不需要泰语依存标注语料,可以在资源成本更低的情况下完成泰语依存句法分析。
基本信息
专利标题 :
基于动态词嵌入对齐的无监督泰语依存句法分析方法
专利标题(英):
暂无
公开(公告)号 :
CN114611487A
申请号 :
CN202210240990.0
公开(公告)日 :
2022-06-10
申请日 :
2022-03-10
授权号 :
暂无
授权日 :
暂无
发明人 :
余正涛张弘弢王剑文永华相艳
申请人 :
昆明理工大学
申请人地址 :
云南省昆明市呈贡区景明南路727号
代理机构 :
昆明隆合知识产权代理事务所(普通合伙)
代理人 :
何娇
优先权 :
CN202210240990.0
主分类号 :
G06F40/211
IPC分类号 :
G06F40/211 G06F40/169 G06F40/284 G06F40/30 G06K9/62 G06N3/04 G06N3/08
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06F
电数字数据处理
G06F40/211
句法分析,例如 基于无上下文语法或统一语法
法律状态
2022-06-10 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载