文本生成模型的训练方法、目标语料扩充方法及相关装置

实质审查的生效

摘要

本申请公开了一种文本生成模型的训练方法、目标语料扩充方法及相关装置。文本生成模型的训练方法包括：获取样本语料；对样本语料进行分词处理，并根据分词处理结果，生成统计语言模型；利用文本生成模型的生成器生成目标文本；根据样本语料利用文本生成模型的判别器对目标文本进行判别，输出判别结果，并根据判别结果得到对抗损失函数；利用统计语言模型获取目标文本的困惑度，并根据困惑度确定惩罚项；将对抗损失函数和惩罚项进行叠加后得到文本生成模型的目标损失函数，并利用目标损失函数对文本生成模型进行训练，得到训练后的文本生成模型。上述方案，能够利用现有语料库来指导文本生成模型的训练，提升文本生成模型的性能。

基本信息

专利标题：

文本生成模型的训练方法、目标语料扩充方法及相关装置

专利标题（英）：

暂无

公开（公告）号：

CN114462570A

申请号：

CN202111670508.9

公开（公告）日：

2022-05-10

申请日：

2021-12-31

授权号：

暂无

授权日：

暂无

发明人：

岳昌洁张锦铖黄惠祥史巍林聚财殷俊

申请人：

浙江大华技术股份有限公司

申请人地址：

浙江省杭州市滨江区滨安路1187号

代理机构：

深圳市威世博知识产权代理事务所(普通合伙)

代理人：

何倚雯

优先权：

CN202111670508.9

主分类号：

G06N3/04

IPC分类号：

G06N3/04 G06N3/08 G06F40/289

IPC结构图谱

G部——物理

G06

计算；推算或计数

G06N

基于特定计算模型的计算机系统

G06N3/00

基于生物学模型的计算机系统

G06N3/02

采用神经网络模型

G06N3/04

体系结构，例如，互连拓扑

法律状态

2022-05-27 ：

实质审查的生效

IPC(主分类) : G06N 3/04
申请日 : 20211231

2022-05-10 ：

公开

注：本法律状态信息仅供参考，即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。

文件下载

暂无PDF文件可下载