文本相似度的获取方法、终端设备及介质
授权
摘要

本发明适用于数据处理技术领域,提供了一种文本相似度的获取方法、终端设备及介质,该方法包括:获取每一待分析文本所分别对应的多个分词后,将分词存入词袋模型;获取每一分词在词袋模型中的TF‑IDF信息;基于各个待分析文本所关联的TF‑IDF信息,分别生成与多个比对文本对应的文本集特征矩阵以及与参照文本对应的文本向量;对文本集特征矩阵进行奇异值分解,并根据得到的单词特征矩阵以及特征向量比重矩阵,对文本向量进行反向映射处理,得到第二特征向量;分别计算每一第二特征向量与第一特征向量的相似度,并将计算结果输出为预设文本与该第二特征向量所匹配的比对文本之间的相似度。本发明提高了文本相似度的计算准确率以及提高了文本的比对效率。

基本信息
专利标题 :
文本相似度的获取方法、终端设备及介质
专利标题(英):
暂无
公开(公告)号 :
CN108710613A
申请号 :
CN201810495130.5
公开(公告)日 :
2018-10-26
申请日 :
2018-05-22
授权号 :
CN108710613B
授权日 :
2022-04-08
发明人 :
李育儒王鸿滨吴晓贝汪伟
申请人 :
平安科技(深圳)有限公司
申请人地址 :
广东省深圳市福田区八卦岭八卦三路平安大厦4楼
代理机构 :
深圳中一专利商标事务所
代理人 :
官建红
优先权 :
CN201810495130.5
主分类号 :
G06F17/27
IPC分类号 :
G06F17/27  
相关图片
法律状态
2022-04-08 :
授权
2020-07-10 :
实质审查的生效
IPC(主分类) : G06F 17/27
申请日 : 20180522
2018-10-26 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
1、
CN108710613A.PDF
PDF下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332