大规模语言模型去偏倚方法、系统、设备及存储介质

实质审查的生效

摘要

本发明提供一种大规模语言模型去偏倚方法、系统、设备及存储介质，包括：获取基于神经网络的大规模预训练语言模型；针对所述大规模预训练语言模型采用数据自生成方法获得用于性别偏倚分析的文本数据，形成语料库，基于所述语料库建立一系列模板；利用所述模板计算所述大规模预训练语言模型的性别偏倚水平，根据性别偏倚水平反向传播计算大规模预训练语言模型的纠偏梯度；根据纠偏梯度更新大规模预训练语言模型中的模型参数，重复寻优更新直至满足预设更新完成条件，得到去性别偏倚的大规模语言模型。因此本发明从信息论的角度分析语言模型的性别偏倚，且将偏差修正问题视为多目标优化问题，以减少偏倚，采用自动生成算法来解决训练数据不足的问题。

基本信息

专利标题：

大规模语言模型去偏倚方法、系统、设备及存储介质

专利标题（英）：

暂无

公开（公告）号：

CN114462395A

申请号：

CN202210184515.6

公开（公告）日：

2022-05-10

申请日：

2022-02-25

授权号：

暂无

授权日：

暂无

发明人：

刘奕然刘潇于洋

申请人：

交叉信息核心技术研究院（西安）有限公司

申请人地址：

陕西省西安市高新区天谷八路软件新城云汇谷156号B2座11层

代理机构：

北京中巡通大知识产权代理有限公司

代理人：

张弘

优先权：

CN202210184515.6

主分类号：

G06F40/237

IPC分类号：

G06F40/237 G06F40/20 G06N3/08 G06N3/04

IPC结构图谱

G部——物理

G06

计算；推算或计数

G06F

电数字数据处理

G06F40/237

词汇工具

法律状态

2022-05-27 ：

实质审查的生效

IPC(主分类) : G06F 40/237
申请日 : 20220225

2022-05-10 ：

公开

注：本法律状态信息仅供参考，即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。

文件下载

暂无PDF文件可下载