一种基于句子检索模式的属性抽取方法
授权
摘要
本发明公开了一种基于句子检索模式的属性抽取方法,该包括:将语料进行预处理,把需要的语料数据导入到语料库;从语料库中或词典或概念模型中的语料数据中抽取语句,并将所需语句组成样本集;采用HanLP句法依存分析器对抽取的语句样本集进行分词和词性标注;采用过滤规则对词性标注的结果集进行过滤,并产生三元属性即:实体属性、关系属性以及实体与实体之间的属性,并得到每一句话的三元组属性集合;对三元组属性集合进行聚合,并将聚合得到的属性集合保存到数据库。本发明提高了关系抽取的效率,减少了人力物力等资源的浪费,解决了现有关系抽取技术的不足之处。
基本信息
专利标题 :
一种基于句子检索模式的属性抽取方法
专利标题(英):
暂无
公开(公告)号 :
CN111241827A
申请号 :
CN202010025572.0
公开(公告)日 :
2020-06-05
申请日 :
2020-01-10
授权号 :
CN111241827B
授权日 :
2022-05-20
发明人 :
乔驰段飞虎印东敏陈锋涛蔡郧冯自强李云鹏戴铁成张宏伟
申请人 :
同方知网(北京)技术有限公司;同方知网数字出版技术股份有限公司
申请人地址 :
北京市海淀区清华园清华大学36区华业大厦B1410、1412、1414室
代理机构 :
北京天奇智新知识产权代理有限公司
代理人 :
王泽云
优先权 :
CN202010025572.0
主分类号 :
G06F40/289
IPC分类号 :
G06F40/289 G06F40/211 G06F40/242 G06F16/31 G06F16/33
相关图片
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06F
电数字数据处理
G06F40/289
短语分析,例如有限状态技术或分块
法律状态
2022-05-20 :
授权
2020-06-30 :
实质审查的生效
IPC(主分类) : G06F 40/289
申请日 : 20200110
申请日 : 20200110
2020-06-05 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
1、
CN111241827A.PDF
PDF下载