基于transformer模型提取同义语块对的方法
实质审查的生效
摘要
本发明涉及同义语块对提取技术领域,特别是指一种基于transformer模型提取同义语块对的方法,方法包括:获取待提取语句对并输入到transformer模型,获取transformer模型内部的ec_att_matrix和ecdc_att_matrix;在ec_att_matrix中,确定满足第一条件的最小内部矩阵,记录对应的语块以及标号,将语块确定为Query语块;对每个Query语块,确定满足第二条件的最小矩阵,确定Query语块对应的Title语块;根据Query语块以及对应的Title语块确定同义语块对。采用本发明,可以解决口语与书面语表达不一致的检索问题,提高效率和准确率。
基本信息
专利标题 :
基于transformer模型提取同义语块对的方法
专利标题(英):
暂无
公开(公告)号 :
CN114417838A
申请号 :
CN202210336467.8
公开(公告)日 :
2022-04-29
申请日 :
2022-04-01
授权号 :
暂无
授权日 :
暂无
发明人 :
殷晓君殷晓东王诚文王鸿滨
申请人 :
北京语言大学
申请人地址 :
北京市海淀区学院路15号
代理机构 :
北京市广友专利事务所有限责任公司
代理人 :
张仲波
优先权 :
CN202210336467.8
主分类号 :
G06F40/247
IPC分类号 :
G06F40/247 G06F40/289
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06F
电数字数据处理
G06F40/247
辞典;同义词
法律状态
2022-05-20 :
实质审查的生效
IPC(主分类) : G06F 40/247
申请日 : 20220401
申请日 : 20220401
2022-04-29 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载