用于对自然语言文本内容进行处理的大数据体系建立方法
授权
摘要
本发明提出了用于对自然语言文本内容进行处理的大数据体系建立方法,包括:获得待处理的自然语言文本;对待处理的自然语言文本进行预处理,将待处理的自然语言文本进行规范化表示;用多个大小不等的卷积窗口对规范化表示的自然语言文本进行卷积及最大池化操作,得到特征向量矩阵;将具有相同实体对的句子经过步骤卷积及最大池化操作后,输出相同实体对特征向量矩阵,计算每个相同实体对特征向量的权重值,得到过滤后的特征向量矩阵,将过滤后的特征向量矩阵与预定的关系矩阵相乘,得到关联程度矩阵,利用目标函数训练和优化参数,得到大数据优化体系对待处理的自然语言文本做处理,输出处理后的目标结果。
基本信息
专利标题 :
用于对自然语言文本内容进行处理的大数据体系建立方法
专利标题(英):
暂无
公开(公告)号 :
CN114386425A
申请号 :
CN202210292434.8
公开(公告)日 :
2022-04-22
申请日 :
2022-03-24
授权号 :
CN114386425B
授权日 :
2022-06-10
发明人 :
李晋刘宇鹏
申请人 :
天津思睿信息技术有限公司
申请人地址 :
天津市滨海新区高新区滨海科技园高新六路39号2号楼2单元201-10号
代理机构 :
天津合正知识产权代理有限公司
代理人 :
吕琦
优先权 :
CN202210292434.8
主分类号 :
G06F40/295
IPC分类号 :
G06F40/295 G06F40/205 G06F40/30 G06K9/62 G06N3/08
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06F
电数字数据处理
G06F40/295
命名实体识别
法律状态
2022-06-10 :
授权
2022-05-10 :
实质审查的生效
IPC(主分类) : G06F 40/295
申请日 : 20220324
申请日 : 20220324
2022-04-22 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载