一种基于深度学习的文本摘要方法及系统
公开
摘要
本发明实施例公开了一种基于深度学习的文本摘要方法及系统,其中方法包括:对目标文件进行中文分词和句子分割处理,将目标文件的原始文本划分为单独的句子;将划分为单独句子的原始文本转换为文本向量;对文本向量进行自注意力计算,得到包含语义信息的句子特征;对通过乱序的自注意力计算得到的各个句子特征进行加权整合,并对加权整合后的句子特征进行归一化处理,得到篇章级的句子特征;将篇章级的句子特征输入预先构建的分类模型,输出句子类别;根据句子类别将目标文件的原始文本划分为关键信息和非关键信息两部分;将关键信息按照合理的顺序进行排列组织,并将排列组织后的关键信息合成语义通顺、语法合规的摘要文本。
基本信息
专利标题 :
一种基于深度学习的文本摘要方法及系统
专利标题(英):
暂无
公开(公告)号 :
CN114385806A
申请号 :
CN202111439109.1
公开(公告)日 :
2022-04-22
申请日 :
2021-11-30
授权号 :
暂无
授权日 :
暂无
发明人 :
徐书豪王亚平赖新明王志刚林文辉伺彦伟祁洪波
申请人 :
航天信息股份有限公司;河北航天信息技术有限公司
申请人地址 :
北京市海淀区杏石口路甲18号
代理机构 :
北京工信联合知识产权代理有限公司
代理人 :
刘海蓉
优先权 :
CN202111439109.1
主分类号 :
G06F16/34
IPC分类号 :
G06F16/34 G06F40/211 G06F40/289 G06F40/30 G06F16/35
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06F
电数字数据处理
G06F16/34
••浏览;其可视化
法律状态
2022-04-22 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载