对象的行业类型识别方法和装置
授权
摘要
本发明提出一种对象的行业类型识别方法和装置,其中,方法包括:将待识别对象的文本信息输入用于生成段落向量的语言模型中进行学习,得到待识别对象的与行业类型相关的向量空间;根据每个待识别对象的向量空间,从所有的待识别对象中选取第一待识别对象作为训练样本对象,获取训练样本对象的标注数据;利用训练样本对象的向量空间和标注数据,对构建的行业类型识别模型进行训练,得到目标行业类型识别模型;针对除训练样本对象之外的每个第二待识别对象,将第二待识别对象的向量空间,输入到目标行业类型识别模型中进行学习,得到第二待识别对象所隶属的行业类型。该方法能够提升行业类型识别模型的识别结果的准确率。
基本信息
专利标题 :
对象的行业类型识别方法和装置
专利标题(英):
暂无
公开(公告)号 :
CN108733778A
申请号 :
CN201810420223.1
公开(公告)日 :
2018-11-02
申请日 :
2018-05-04
授权号 :
CN108733778B
授权日 :
2022-05-17
发明人 :
赵辉崔燕岳爱珍谭静
申请人 :
百度在线网络技术(北京)有限公司
申请人地址 :
北京市海淀区上地十街10号百度大厦三层
代理机构 :
北京清亦华知识产权代理事务所(普通合伙)
代理人 :
宋合成
优先权 :
CN201810420223.1
主分类号 :
G06F17/30
IPC分类号 :
G06F17/30
法律状态
2022-05-17 :
授权
2018-11-27 :
实质审查的生效
IPC(主分类) : G06F 17/30
申请日 : 20180504
申请日 : 20180504
2018-11-02 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载