基于主题词和语句主旨的自动匹配方法、系统及存储介质
授权
摘要
本发明的提供了基于主题词和语句主旨的自动匹配方法、系统及存储介质,方法包括以下步骤:获取第一文本,从第一文本中提取得到第二文本;切分第二文本,并将切分后得到文字进行编码,得到编码后的序列信息,根据编码后的序列信息对第一文本进行bert编码,对bert编码后的第一文本进行信息提取,得到主题词以及主旨要义向量,根据主题词以及主旨要义向量得到匹配相关性;根据主题词、主旨要义向量以及匹配相关性训练第一预测模型,并得到待筛选文本和目标文本的匹配分数;方法执行的过程中占用较少的计算资源具有更强的内容感知能力,过程所涉及的数据量少,能够更为快速地完成匹配处理,可广泛应用于自然语言处理技术领域。
基本信息
专利标题 :
基于主题词和语句主旨的自动匹配方法、系统及存储介质
专利标题(英):
暂无
公开(公告)号 :
CN111881257A
申请号 :
CN202010720583.0
公开(公告)日 :
2020-11-03
申请日 :
2020-07-24
授权号 :
CN111881257B
授权日 :
2022-06-03
发明人 :
彭凌西蒋镇鸿施磊
申请人 :
广州大学
申请人地址 :
广东省广州市大学城外环西路230号
代理机构 :
广州嘉权专利商标事务所有限公司
代理人 :
胡辉
优先权 :
CN202010720583.0
主分类号 :
G06F16/33
IPC分类号 :
G06F16/33 G06F40/126 G06F40/30 G06N3/04 G06Q10/10
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06F
电数字数据处理
G06F16/33
••查询
法律状态
2022-06-03 :
授权
2020-11-20 :
实质审查的生效
IPC(主分类) : G06F 16/33
申请日 : 20200724
申请日 : 20200724
2020-11-03 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载