一种文本处理方法、装置、设备及存储介质
公开
摘要
本申请公开了一种文本处理方法、装置、设备及存储介质,方法包括:获取待预测文本的第一语义向量,待预测文本为多媒体数据的标题文本;采用优化后的层次分类模型,基于第一语义向量预测待预测文本的一级类目,得到一个或多个一级预测类目;将第一语义向量与预设词向量集中的每个二级类目的词向量进行匹配处理,以得到一个或多个第一匹配特征;采用优化后的层次分类模型,基于一个或多个第一匹配特征和一个或多个一级预测类目,从一个或多个二级类目中确定待预测文本的目标二级类目;根据预先建立的二级类目和一级类目的对应关系,获取目标二级类目对应的目标一级类目;生成待预测文本的类目信息,可提升预测到的类目信息的准确度。
基本信息
专利标题 :
一种文本处理方法、装置、设备及存储介质
专利标题(英):
暂无
公开(公告)号 :
CN114328807A
申请号 :
CN202110978569.5
公开(公告)日 :
2022-04-12
申请日 :
2021-08-24
授权号 :
暂无
授权日 :
暂无
发明人 :
黄剑辉
申请人 :
腾讯科技(深圳)有限公司
申请人地址 :
广东省深圳市南山区高新区科技中一路腾讯大厦35层
代理机构 :
广州三环专利商标代理有限公司
代理人 :
熊永强
优先权 :
CN202110978569.5
主分类号 :
G06F16/33
IPC分类号 :
G06F16/33 G06F16/35 G06F40/205 G06F40/30 G06N3/04 G06N3/08
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06F
电数字数据处理
G06F16/33
••查询
法律状态
2022-04-12 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载