基于预训练模型和序列标注模型的API敏感字段识别方法

实质审查的生效

摘要

基于预训练模型和序列标注模型的API敏感字段识别方法，包括以下步骤：先使用api数据的路径文本和响应内容文本训练基于字符粒度的预训练模型apiBERT；使用api文本数据训练掩码语言模型apiBERT，将带有掩码的路径名和响应内容拼接，输入到模型apiBERT中，输出被遮掩的字符；基于预训练模型apiBERT使用敏感内容标注数据进行精调；敏感字段识别序列标注模型训练。本发明克服了现有技术的不足，解决需对规则和敏感字段不断补充的依赖问题。

基本信息

专利标题：

基于预训练模型和序列标注模型的API敏感字段识别方法

专利标题（英）：

暂无

公开（公告）号：

CN114417410A

申请号：

CN202210060723.5

公开（公告）日：

2022-04-29

申请日：

2022-01-19

授权号：

暂无

授权日：

暂无

发明人：

陈件张井陈云财潘丽婷

申请人：

上海一者信息科技有限公司

申请人地址：

上海市杨浦区隆昌路588_1号1210室

代理机构：

上海骁象知识产权代理有限公司

代理人：

赵俊寅

优先权：

CN202210060723.5

主分类号：

G06F21/62

IPC分类号：

G06F21/62 G06F8/36 G06F8/41 G06F40/289 G06K9/62

IPC结构图谱

G部——物理

G06

计算；推算或计数

G06F

电数字数据处理

G06F21/00

防止未授权行为的保护计算机、其部件、程序或数据的安全装置

G06F21/60

保护数据

G06F21/62

通过一个平台保护数据存取访问，例如使用密钥或访问控制规则

法律状态

2022-05-20 ：

实质审查的生效

IPC(主分类) : G06F 21/62
申请日 : 20220119

2022-04-29 ：

公开

注：本法律状态信息仅供参考，即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。

文件下载

暂无PDF文件可下载