一种基于语义计算的分类器构建方法、分类器
授权
摘要
本发明属于信息检索及其数据库结构技术领域,公开了一种基于语义计算的分类器构建方法、分类器,利用神经网络模型在维基百科数据上训练词向量,获得词的分布式表征;通过分类标签获得分类的向量表示,同时利用加权平均的方法获得文本的向量表示;通过计算分类向量和文本向量之间的语义关系来获得文本所属的最可能的分类。本发明的非监督学习阶段无需标注数据,仅仅需要用户定义少量特征词即可完成分类器的创建,上线速度快,无需等待漫长的标注数据积累;非监督学习阶段可以充分利用现有的有限标注数据,通过提取有效特征词来指导和提高非监督分类能力。
基本信息
专利标题 :
一种基于语义计算的分类器构建方法、分类器
专利标题(英):
暂无
公开(公告)号 :
CN108388914A
申请号 :
CN201810159255.0
公开(公告)日 :
2018-08-10
申请日 :
2018-02-26
授权号 :
CN108388914B
授权日 :
2022-04-01
发明人 :
宋俊平程国艮
申请人 :
中译语通科技股份有限公司
申请人地址 :
北京市石景山区石景山路20号16层1601
代理机构 :
北京万贝专利代理事务所(特殊普通合伙)
代理人 :
马红
优先权 :
CN201810159255.0
主分类号 :
G06K9/62
IPC分类号 :
G06K9/62 G06F17/30
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06K
数据识别;数据表示;记录载体;记录载体的处理
G06K9/00
用于阅读或识别印刷或书写字符或者用于识别图形,例如,指纹的方法或装置
G06K9/62
应用电子设备进行识别的方法或装置
法律状态
2022-04-01 :
授权
2018-09-04 :
实质审查的生效
IPC(主分类) : G06K 9/62
申请日 : 20180226
申请日 : 20180226
2018-08-10 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载