基于标签图抑制噪声数据影响的远程监督关系抽取方法及装置
公开
摘要
本发明公开了一种基于标签图抑制噪声数据影响的远程监督关系抽取方法及装置,包括基于实体对的原始标签,构建标签图;生成所述标签图的标签表示矩阵;收集包含目标实体对的句子sj,得到句子包;结合所述目标实体对在每一句子j中的位置与目标实体对的向量表示,计算每一句子sj的句子表示oj;计算所述标签l对于所述句子表示oj的权重αlj;对所述句子表示oj进行加权求和,得到所述句子包在所述标签l下的句子包表示bl;计算句子包表示bl在标签l下的分数gl;拼接所述分数gl,并基于得到的基本标签的分数向量gb,获取所述目标实体对的原始标签。本发明更好地解决了远程监督关系抽取任务中噪声数据影响模型训练的问题。
基本信息
专利标题 :
基于标签图抑制噪声数据影响的远程监督关系抽取方法及装置
专利标题(英):
暂无
公开(公告)号 :
CN114461747A
申请号 :
CN202210049778.6
公开(公告)日 :
2022-05-10
申请日 :
2022-01-17
授权号 :
暂无
授权日 :
暂无
发明人 :
陈小军李毓伟王大魁许洪波曾帅丁阳阳
申请人 :
中国科学院信息工程研究所
申请人地址 :
北京市海淀区闵庄路甲89号
代理机构 :
北京君尚知识产权代理有限公司
代理人 :
陈艳
优先权 :
CN202210049778.6
主分类号 :
G06F16/31
IPC分类号 :
G06F16/31 G06F40/279 G06N3/04 G06N3/08 G06N5/02
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06F
电数字数据处理
G06F16/31
••索引;其数据结构;存储结构
法律状态
2022-05-10 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载