一种嵌套安全实体识别模型的训练方法及识别方法
公开
摘要
本发明公开了一种嵌套安全实体识别模型的训练方法及识别方法,获取包括多条句子样本的样本文本数据,并为各句子样本添加第一标签;基于添加标签后的各句子样本,执行如下步骤进行训练:基于各句子样本利用第一子模型输出该句子样本中包含的第一实体的最大边界和相应的第一边界标识;根据第一子模型输出的各第一实体和相应的第一边界标识,确定该句子样本的候选片段序列集合;基于候选片段序列集合中的各候选片段序列,利用第二子模型对该候选片段序列包含的各实体进行分类;联合调整第一子模型和第二子模型的参数,以完成训练。本公开的方法识别模型训练完成之后,用于嵌套安全实体的识别,尤其适用于对存在嵌套的实体的识别分类。
基本信息
专利标题 :
一种嵌套安全实体识别模型的训练方法及识别方法
专利标题(英):
暂无
公开(公告)号 :
CN114298040A
申请号 :
CN202111413428.5
公开(公告)日 :
2022-04-08
申请日 :
2021-11-25
授权号 :
暂无
授权日 :
暂无
发明人 :
潘季明姚剑文
申请人 :
北京天融信网络安全技术有限公司;北京天融信科技有限公司;北京天融信软件有限公司
申请人地址 :
北京市海淀区上地东路1号院3号楼四层
代理机构 :
工业和信息化部电子专利中心
代理人 :
田卫平
优先权 :
CN202111413428.5
主分类号 :
G06F40/295
IPC分类号 :
G06F40/295 G06F16/35
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06F
电数字数据处理
G06F40/295
命名实体识别
法律状态
2022-04-08 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载