一种融合多粒度信息的文本蕴含关系识别方法
授权
摘要
本发明提供一种融合多粒度信息的文本蕴含关系识别方法,提出融合字与词、词与词、词与句之间多粒度信息融合与交互的建模方法。本发明首先在字符向量层使用卷积神经网络和Highway网络层建立基于字符级别的词向量模型,并与GloVe预训练的词向量拼接;之后句子建模层将融合字词粒度的词向量使用双向长短时记忆网络进行建模,再经过句子匹配层对文本对进行融合注意力机制的交互与匹配,最后通过整合分类层求得类别;模型建立好后将模型进行训练和测试最终获取测试样本的文本蕴含识别分类结果。这种融合了字、词、句多粒度信息的层次化组合结构方法融合了模型中浅层的特征定位和深层的特征学习等优势,从而进一步提升文本蕴含关系识别的准确性。
基本信息
专利标题 :
一种融合多粒度信息的文本蕴含关系识别方法
专利标题(英):
暂无
公开(公告)号 :
CN109299262A
申请号 :
CN201811174143.9
公开(公告)日 :
2019-02-01
申请日 :
2018-10-09
授权号 :
CN109299262B
授权日 :
2022-04-15
发明人 :
王慧瑶郭泽颖印鉴高静
申请人 :
中山大学;广东恒电信息科技股份有限公司
申请人地址 :
广东省广州市海珠区新港西路135号
代理机构 :
广州粤高专利商标代理有限公司
代理人 :
林丽明
优先权 :
CN201811174143.9
主分类号 :
G06F16/35
IPC分类号 :
G06F16/35 G06F17/27 G06N3/04 G06N3/08 G06K9/62
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06F
电数字数据处理
G06F16/35
••聚类;分类
法律状态
2022-04-15 :
授权
2019-03-01 :
实质审查的生效
IPC(主分类) : G06F 16/35
申请日 : 20181009
申请日 : 20181009
2019-02-01 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载