一种基于网络表征和语义表征的同名作者消歧方法
授权
摘要
本发明公开了一种基于网络表征和语义表征的同名作者消歧方法。本方法为:1)提取目标论文库中各论文的语义特征和离散特征;2)基于离散特征计算各论文间的相似度,得到论文的关系相似性矩阵;如果一论文与其他论文没有共同作者或机构,则将其加入一离群论文集中;3)基于各论文的所述语义特征计算论文的语义相似度矩阵;将目标论文库中不包含语义特征的论文加入离群论文集中;4)将关系相似性矩阵和语义相似度矩阵加权求和,获得论文相似度矩阵并对其进行聚类;将不属于任何簇的论文加入离群论文集中;5)利用基于相似度阈值匹配的方法将离群论文集中的论文分配到对应的簇中。本发明实现高准确率的论文同名作者的消歧。
基本信息
专利标题 :
一种基于网络表征和语义表征的同名作者消歧方法
专利标题(英):
暂无
公开(公告)号 :
CN111191466A
申请号 :
CN201911352416.9
公开(公告)日 :
2020-05-22
申请日 :
2019-12-25
授权号 :
CN111191466B
授权日 :
2022-04-01
发明人 :
杜一王寒雪乔子越周园春
申请人 :
中国科学院计算机网络信息中心
申请人地址 :
北京市海淀区中关村南四街4号
代理机构 :
北京君尚知识产权代理有限公司
代理人 :
司立彬
优先权 :
CN201911352416.9
主分类号 :
G06F40/35
IPC分类号 :
G06F40/35 G06F40/279 G06F16/35
相关图片
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06F
电数字数据处理
G06F40/35
话语或对话表示
法律状态
2022-04-01 :
授权
2020-06-16 :
实质审查的生效
IPC(主分类) : G06F 40/35
申请日 : 20191225
申请日 : 20191225
2020-05-22 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
1、
CN111191466A.PDF
PDF下载