一种基于Bert与Scat的页岩气领域命名实体识别方法
公开
摘要
本发明公开了一种基于Bert与Scat的页岩气领域命名实体识别方法,构建页岩气领域命名实体识别模型,所述方法包括步骤:获取预训练好的Bert模型;对页岩气领域的原始语料数据进行预处理,并构建预训练集;将构建的预训练集输入到Bert模型;将Bert语言模型的输出信息依次输入到双向LSTM神经网络以及Scat联合模块中,对双向LSTM神经网络及Scat联合模块进行多次迭代训练,在通过二分法来实现最佳实体预测;使用训练完成得到的完整页岩气领域命名实体识别模型,对页岩气领域文本进行命名实体识别。本发明解决了传统的神经网络方法无法区别页岩气领域多级实体边界的情况,并通过引入的二分法,实现实体预测的强纠正,在一定程度上提高了页岩气领域命名实体识别的效果。
基本信息
专利标题 :
一种基于Bert与Scat的页岩气领域命名实体识别方法
专利标题(英):
暂无
公开(公告)号 :
CN114580423A
申请号 :
CN202210322494.X
公开(公告)日 :
2022-06-03
申请日 :
2022-03-29
授权号 :
暂无
授权日 :
暂无
发明人 :
陈怡男苏作新朱西平卢星宇肖丽娟高昂郭露李映璋
申请人 :
西南石油大学
申请人地址 :
四川省成都市新都区新都大道8号
代理机构 :
代理人 :
优先权 :
CN202210322494.X
主分类号 :
G06F40/295
IPC分类号 :
G06F40/295 G06F40/35 G06K9/62 G06N3/04 G06N3/08 G06F16/35 G06F16/335
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06F
电数字数据处理
G06F40/295
命名实体识别
法律状态
2022-06-03 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载