抄袭源检索排序模型构建方法和抄袭源检索排序方法
授权
摘要

本发明提供了一种抄袭源检索排序模型构建方法和抄袭源检索排序方法。抄袭源检索排序模型构建方法基于参考文档的每个抄袭源文档与该参考文档之间的聚合度,利用训练样本、通过基于序对的排序学习方式对预定排序逻辑回归模型进行训练,直至预定损失函数的值最小,预定损失函数包括第一和第二子损失函数,第一子损失函数表示基于参考文档的抄袭源文档和非抄袭源文档构成的序对的排序错误带来的损失,而第二子损失函数表示由具有不同的聚合度的抄袭源文档构成的序对的排序错误带来的损失。抄袭源检索排序方法利用上述获得的排序模型对可疑文档的检索结果进行重排序。本发明的上述技术能够在抄袭检测中对可疑文档的源检索结果进行更准确地排序。

基本信息
专利标题 :
抄袭源检索排序模型构建方法和抄袭源检索排序方法
专利标题(英):
暂无
公开(公告)号 :
CN108829791A
申请号 :
CN201810557843.X
公开(公告)日 :
2018-11-16
申请日 :
2018-06-01
授权号 :
CN108829791B
授权日 :
2022-04-05
发明人 :
孔蕾蕾韩中元齐浩亮
申请人 :
黑龙江工程学院
申请人地址 :
黑龙江省哈尔滨市道外区红旗大街999号
代理机构 :
哈尔滨市阳光惠远知识产权代理有限公司
代理人 :
刘景祥
优先权 :
CN201810557843.X
主分类号 :
G06F17/30
IPC分类号 :
G06F17/30  
相关图片
法律状态
2022-04-05 :
授权
2018-12-11 :
实质审查的生效
IPC(主分类) : G06F 17/30
申请日 : 20180601
2018-11-16 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
1、
CN108829791A.PDF
PDF下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332