一种基于双编码指针混合网络的中文摘要生成方法
实质审查的生效
摘要
本发明涉及一种双编码指针混合网络的中文摘要生成方法,包括:从语料数据集中获取中文文本数据,中文文本数据包括正文文本及对应的摘要;对获取的中文文本数据进行预处理,并将预处理后的中文文本数据按照设定的比例划分为训练集、验证集和测试集;根据训练集、验证集和测试集,创建对应的词典;基于双编码指针混合网络算法,构建双编码模型;基于训练集和验证集,对双编码模型进行训练和交叉验证;基于测试集对训练后的双编码模型进行测试,以得到中文摘要生成模型;将目标文本输入中文摘要生成模型,输出得到对应的中文摘要。与现有技术相比,本发明能够自动、准确地生成对应于中文文本的中文摘要,具有准确率高、概括能力强、语句通顺的优点。
基本信息
专利标题 :
一种基于双编码指针混合网络的中文摘要生成方法
专利标题(英):
暂无
公开(公告)号 :
CN114357154A
申请号 :
CN202111420505.X
公开(公告)日 :
2022-04-15
申请日 :
2021-11-26
授权号 :
暂无
授权日 :
暂无
发明人 :
陈海光刘明星齐子锋黄继风
申请人 :
上海师范大学
申请人地址 :
上海市徐汇区桂林路100号
代理机构 :
上海科盛知识产权代理有限公司
代理人 :
叶敏华
优先权 :
CN202111420505.X
主分类号 :
G06F16/35
IPC分类号 :
G06F16/35 G06K9/62 G06N3/04 G06N3/08
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06F
电数字数据处理
G06F16/35
••聚类;分类
法律状态
2022-05-03 :
实质审查的生效
IPC(主分类) : G06F 16/35
申请日 : 20211126
申请日 : 20211126
2022-04-15 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载