基于句子特征分数加权的抽取式文本摘要生成方法及装置
公开
摘要

本发明公开了一种基于句子特征分数加权的抽取式文本摘要生成方法及装置,通过在句子打分式基础模型得到的基础模型分数增加标题词汇特征、首句特征和句长特征,采用句子打分式基础模型计算出主题集中句子i的基础模型分数Si,基于标题词表中词汇的个数以及句子i中出现标题词表中的词汇的个数计算得到标题词汇特征分数Fh,响应于句子i为首句得到首句特征分数Ff,基于平均长度与句子i的长度计算得到句长特征分数Fl。最后将基础模型分数Si、标题词汇特征分数Fh、首句特征分数Ff、句长特征分数Fl相乘得到句子分数,重复上述步骤获得所有句子的句子分数并以在所述主题集中提取出目标摘要。本发明可以明显提高模型的性能,增加文本摘要抽取的准确性。

基本信息
专利标题 :
基于句子特征分数加权的抽取式文本摘要生成方法及装置
专利标题(英):
暂无
公开(公告)号 :
CN114297369A
申请号 :
CN202111603005.X
公开(公告)日 :
2022-04-08
申请日 :
2021-12-24
授权号 :
暂无
授权日 :
暂无
发明人 :
李依宁肖龙源李威
申请人 :
厦门快商通科技股份有限公司
申请人地址 :
福建省厦门市软件园三期诚毅北大街63号1301单元
代理机构 :
厦门市首创君合专利事务所有限公司
代理人 :
连耀忠
优先权 :
CN202111603005.X
主分类号 :
G06F16/34
IPC分类号 :
G06F16/34  G06N3/02  G06N3/08  
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06F
电数字数据处理
G06F16/34
••浏览;其可视化
法律状态
2022-04-08 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332