实体链接方法、实体链接模型训练方法及电子设备
公开
摘要
本发明提供一种实体链接方法、实体链接模型训练方法及电子设备,方法通过获取文本中的待链接实体;将待链接实体输入至实体链接模型,获取实体链接模型输出的待链接实体与知识库中各实体的匹配分值;其中,实体链接模型是基于第一预设数量的弱监督数据样本、第二预设数量的真实数据样本和预先确定的实体标签训练后得到的,真实数据样本用于通过元学习规则调整弱监督数据样本的权重为目标训练权重,弱监督数据样本和真实数据样本均包括实体名称样本、实体提及样本和实体提及的上下文样本,第一预设数量大于第二预设数量;将待链接实体链接至知识库中匹配分值最高的实体,通过少量的真实数据样本提高实体链接模型的精确度,更准确的实现了实体链接。
基本信息
专利标题 :
实体链接方法、实体链接模型训练方法及电子设备
专利标题(英):
暂无
公开(公告)号 :
CN114298042A
申请号 :
CN202111444208.9
公开(公告)日 :
2022-04-08
申请日 :
2021-11-30
授权号 :
暂无
授权日 :
暂无
发明人 :
李振宇李秀星段智超董博文王建勇
申请人 :
清华大学
申请人地址 :
北京市海淀区双清路30号清华大学
代理机构 :
北京路浩知识产权代理有限公司
代理人 :
么立双
优先权 :
CN202111444208.9
主分类号 :
G06F40/295
IPC分类号 :
G06F40/295 G06F40/30 G06N5/02 G06N3/08 G06N3/04
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06F
电数字数据处理
G06F40/295
命名实体识别
法律状态
2022-04-08 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载