文本聚类方法、装置、设备及存储介质
公开
摘要
本发明公开了一种文本聚类方法、装置、设备及存储介质。涉及人工智能技术领域,其中一种文本聚类方法包括:通过基于预设的文本模型获取新增的文本数据;对与每一类别所对应的文本数据进行分句处理,得到文本句向量集;对文本句向量集进行均值聚类处理,确定出与文本数据对应的目标聚类中心数据;对目标聚类中心数据进行识别处理,识别出文本数据的文本类别。通过本公开实施例能够仅对新增的文本数据进行处理,不需要原始模型数据的参与,就能识别出新增文本数据的文本类别。通过本申请公开的实施例能够仅对新增的文本数据进行处理,不需要原始模型数据的参与,就能识别出新增文本数据的文本类别。
基本信息
专利标题 :
文本聚类方法、装置、设备及存储介质
专利标题(英):
暂无
公开(公告)号 :
CN114416982A
申请号 :
CN202210017422.4
公开(公告)日 :
2022-04-29
申请日 :
2022-01-07
授权号 :
暂无
授权日 :
暂无
发明人 :
黄洪杨磊
申请人 :
北京滴普科技有限公司
申请人地址 :
北京市海淀区彩和坊路8号4层406
代理机构 :
北京中政联科专利代理事务所(普通合伙)
代理人 :
赖学能
优先权 :
CN202210017422.4
主分类号 :
G06F16/35
IPC分类号 :
G06F16/35 G06K9/62
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06F
电数字数据处理
G06F16/35
••聚类;分类
法律状态
2022-04-29 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载