包含近似词语的文本的分组方法、装置及介质
公开
摘要
本公开涉及包含近似词语的文本的分组方法、装置及介质。提供了一种对包含近似词语的多个文本进行分组的方法,包括:对多个文本进行初始分组,包括:计算多个文本中的任意两个文本之间的相似度;将相似度大于第一相似度阈值的文本归类为一个初始分组,形成一个或多个初始分组;在存在多个初始分组的情况下,对多个初始分组进行第一层分组,包括:计算多个初始分组中的任意两个初始分组之间的相似度;对于每个初始分组,找到与该初始分组相似度最高的相似初始分组,如果该初始分组与相似初始分组之间的相似度大于第二相似度阈值,则将该初始分组与相似初始分组归类为一个第一层分组,形成一个或多个第一层分组。
基本信息
专利标题 :
包含近似词语的文本的分组方法、装置及介质
专利标题(英):
暂无
公开(公告)号 :
CN114491009A
申请号 :
CN202011253358.7
公开(公告)日 :
2022-05-13
申请日 :
2020-11-11
授权号 :
暂无
授权日 :
暂无
发明人 :
杨诗友
申请人 :
中国电信股份有限公司
申请人地址 :
北京市西城区金融大街31号
代理机构 :
中国贸促会专利商标事务所有限公司
代理人 :
张荣海
优先权 :
CN202011253358.7
主分类号 :
G06F16/35
IPC分类号 :
G06F16/35 G06F16/33 G06F40/289
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06F
电数字数据处理
G06F16/35
••聚类;分类
法律状态
2022-05-13 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载