训练样本生成、文本数据、舆情事件分类方法及相关设备

授权

摘要

本申请公开了训练样本生成、文本数据、舆情事件分类方法及相关设备，在本申请实施例提供的训练样本生成方法中，首先对文本数据进行聚类处理，因为文本数据被聚类，当找到一个目标类别对应的聚类结果后，只需要在其对应的聚类结果中去选择符合目标类别条件的文本数据然后进行类别标注，就可以得到这个目标类别的训练样本，而不用再去分析其他聚类中的文本数据是否存在符合目标类别条件的情况。因此，极大的缩小了文本数据的选择范围，提高了标注的效率和样本的准确性，缩短了标注文本数据的时间。同时，提升了文本数据分类和舆情事件分类过程的效率和准确性。

基本信息

专利标题：

训练样本生成、文本数据、舆情事件分类方法及相关设备

专利标题（英）：

暂无

公开（公告）号：

CN109299271A

申请号：

CN201811278481.7

公开（公告）日：

2019-02-01

申请日：

2018-10-30

授权号：

CN109299271B

授权日：

2022-04-05

发明人：

袁恺村

申请人：

腾讯科技（深圳）有限公司

申请人地址：

广东省深圳市南山区高新区科技中一路腾讯大厦35层

代理机构：

深圳市深佳知识产权代理事务所(普通合伙)

代理人：

王仲凯

优先权：

CN201811278481.7

主分类号：

G06F16/35

IPC分类号：

G06F16/35 G06F16/9535 G06F17/27