机器阅读理解方法及装置
公开
摘要
本发明提供一种机器阅读理解方法及装置,其中,该方法包括:基于目标文档,获取多个文档片段,基于目标文档,获取多个第一图片,且基于文档片段,获取文档片段中的词语及各词语的位置信息;基于各文档片段中的词语,为文档片段和文档片段对应的第一图片建立索引;基于第一问题文本和索引,将各文档片段中的至少一个确定为候选片段;将第一问题文本、候选片段、候选片段对应的第一图片和候选片段中的各词语的位置信息输入阅读理解模型,进行答案抽取,获取答案片段。本发明提供的机器阅读理解方法及装置,能实现直接对包含图文的文档进行机器阅读理解,直接从文档中抽取答案片段,步骤更简单,效率更高,还能提高机器阅读理解的使用范围。
基本信息
专利标题 :
机器阅读理解方法及装置
专利标题(英):
暂无
公开(公告)号 :
CN114579796A
申请号 :
CN202210483756.0
公开(公告)日 :
2022-06-03
申请日 :
2022-05-06
授权号 :
暂无
授权日 :
暂无
发明人 :
侯晋峰肖立鹏
申请人 :
北京沃丰时代数据科技有限公司
申请人地址 :
北京市丰台区汽车博物馆东路6号3号楼1单元2层201
代理机构 :
北京路浩知识产权代理有限公司
代理人 :
张睿
优先权 :
CN202210483756.0
主分类号 :
G06F16/583
IPC分类号 :
G06F16/583 G06F16/535 G06F16/51 G06F40/289
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06F
电数字数据处理
G06F16/583
•••使用从内容中自动派生的元数据
法律状态
2022-06-03 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载