一种基于文本结构的文本分析方法、系统、设备和介质
公开
摘要

本发明涉及一种基于文本结构的文本分析方法、系统、设备和介质,其包括以下步骤:对获取的待分析文本进行解析,得到其文本结构;分别对待分析文本的各文本结构进行机器阅读,得到各文本结构所对应的嵌入向量;将得到的各嵌入向量进行融合,得到融合的文章嵌入向量;基于融合得到的文章嵌入向量得到文本分析结果。本发明考虑了文章结构对于机器理解的重要意义,依照摘要‑段落{段落标题‑段落内容}的结构进行解析,使模型具有了分结构阅读的能力。因此,本发明可以广泛应用于文本分析领域。

基本信息
专利标题 :
一种基于文本结构的文本分析方法、系统、设备和介质
专利标题(英):
暂无
公开(公告)号 :
CN114611484A
申请号 :
CN202210145827.6
公开(公告)日 :
2022-06-10
申请日 :
2022-02-17
授权号 :
暂无
授权日 :
暂无
发明人 :
许伟杜玮王明明徐顿
申请人 :
中国人民大学
申请人地址 :
北京市海淀区中关村大街59号中国人民大学
代理机构 :
北京纪凯知识产权代理有限公司
代理人 :
冀志华
优先权 :
CN202210145827.6
主分类号 :
G06F40/205
IPC分类号 :
G06F40/205  G06F40/258  G06F40/284  G06K9/62  
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06F
电数字数据处理
G06F40/205
解析
法律状态
2022-06-10 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332