一种基于数据增强的阅读理解选择题答题方法
授权
摘要

本发明涉及自然语言处理领域,具体涉及一种基于数据增强的阅读理解选择题答题方法。所述方法为:利用滑动窗口方法裁剪阅读理解选择题的背景材料;规范阅读理解选择题的背景材料、题干和选项数据格式;利用TF‑IDF方法从词频角度提取答题候选句,得到答题材料句子集X;利用Bi‑Attention从高维句向量角度提取答题候选句,得到答题材料句子集X;合并去重S3、S4所得的句子集X、Y,得到候选句集Z;利用适应于阅读理解选择题的EDA策略扩充候选句集Z,得到最终数据增强候选句集;将最终数据增强候选句集输入到BERT模型做阅读理解选择题答案预测。

基本信息
专利标题 :
一种基于数据增强的阅读理解选择题答题方法
专利标题(英):
暂无
公开(公告)号 :
CN112784579A
申请号 :
CN202011630675.6
公开(公告)日 :
2021-05-11
申请日 :
2020-12-31
授权号 :
CN112784579B
授权日 :
2022-05-27
发明人 :
张虎张颖雷登斌潘邦泽杨陟卓李茹
申请人 :
山西大学
申请人地址 :
山西省太原市坞城路92号
代理机构 :
太原申立德知识产权代理事务所(特殊普通合伙)
代理人 :
郭海燕
优先权 :
CN202011630675.6
主分类号 :
G06F40/216
IPC分类号 :
G06F40/216  G06F40/279  G06F40/289  
相关图片
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06F
电数字数据处理
G06F40/216
使用统计方法
法律状态
2022-05-27 :
授权
2021-05-28 :
实质审查的生效
IPC(主分类) : G06F 40/216
申请日 : 20201231
2021-05-11 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
1、
CN112784579A.PDF
PDF下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332