一种基于对抗训练的审计领域命名实体识别方法
公开
摘要
随着新审计法的颁布,从审计领域语料中自动识别有效实体信息,有利于提高审计政策落实的效率。命名实体识别(Named Entity Recognition,NER)旨在识别语料中的实体,且深度学习方法在该任务上应用成熟且成果显著,但审计领域语料的数据库不够完善,对于实体边界划分也不够清晰。本发明提出了一种基于对抗训练的审计领域命名实体识别方法。中文分词(Chinese Word Segmentation,CWS)用于识别词的边界,与NER有许多相同的词边界信息,使用相同之处来辅助NER任务并帮助进行边界的划分。使用BERT得到词向量,通过对抗训练来提取NER任务和CWS任务的共享信息,同时有效防止CWS任务的私有信息带来的噪声,并将任务共享的词边界信息融合到NER任务中,提高审计领域命名实体识别的精确度。
基本信息
专利标题 :
一种基于对抗训练的审计领域命名实体识别方法
专利标题(英):
暂无
公开(公告)号 :
CN114462409A
申请号 :
CN202210109168.0
公开(公告)日 :
2022-05-10
申请日 :
2022-01-28
授权号 :
暂无
授权日 :
暂无
发明人 :
钱泰羽陈一飞乔红岩
申请人 :
南京审计大学
申请人地址 :
江苏省南京市浦口区江浦街道雨山西路86号
代理机构 :
东莞市卓易专利代理事务所(普通合伙)
代理人 :
高倩倩
优先权 :
CN202210109168.0
主分类号 :
G06F40/295
IPC分类号 :
G06F40/295 G06N3/04 G06N3/08
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06F
电数字数据处理
G06F40/295
命名实体识别
法律状态
2022-05-10 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载