用于文本处理的实体关系抽取方法及装置
授权
摘要

本申请公开了一种用于文本处理的实体关系抽取方法及装置。该方法包括:输入待处理文本;识别所述待处理文本中的实体,其中,所述待处理文本包括多个实体;根据预设样例对所述实体筛选得到输入实例的上下文特征;通过所述上下文特征计算所述输入实例与种子样例库中的各个种子样例之间的上下文相似度;判断所述上下文相似度是否大于第一预设阈值;如果所述相似度大于所述第一预设阈值,则统计所述相似度大于所述预设阈值的种子样例的个数;判断所述相似度大于所述预设阈值的种子样例的个数是否大于所述第二预设阈值;如果所述相似度大于所述预设阈值的种子样例的个数大于所述第二预设阈值,则将所述输入实例作为所述文本处理得到的实体关系实例。本申请解决了规则方法的高准确低召回的技术问题。

基本信息
专利标题 :
用于文本处理的实体关系抽取方法及装置
专利标题(英):
暂无
公开(公告)号 :
CN108763192A
申请号 :
CN201810348221.6
公开(公告)日 :
2018-11-06
申请日 :
2018-04-18
授权号 :
CN108763192B
授权日 :
2022-04-19
发明人 :
朱耀邦高翔纪达麒陈运文
申请人 :
达而观信息科技(上海)有限公司
申请人地址 :
上海市浦东新区亮秀路112号Y1座515室
代理机构 :
北京卓唐知识产权代理有限公司
代理人 :
唐海力
优先权 :
CN201810348221.6
主分类号 :
G06F17/27
IPC分类号 :
G06F17/27  G06F17/30  G06K9/62  
相关图片
法律状态
2022-04-19 :
授权
2018-11-30 :
实质审查的生效
IPC(主分类) : G06F 17/27
申请日 : 20180418
2018-11-06 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
1、
CN108763192A.PDF
PDF下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332