对文本中的事件论元进行抽取的方法和电子设备
公开
摘要
本公开涉及一种对文本中的事件论元进行抽取的方法和电子设备,该方法包括:对待处理文本中包含的事件类型进行检测,得到目标事件类型;根据该目标事件类型及对应的目标论元角色的先验关联信息,构造得到论元抽取问题;将待处理文本和论元抽取问题进行拼接,得到目标文本;将该目标文本的表示向量输入至机器阅读理解模型中,该模型包括两层依序设置的分类器,第一层分类器同步对该目标文本是否存在答案、对答案的开始位置和结束位置进行识别预测,得到携带有答案指示标签的位置预测结果;第二层分类器对开始位置和结束位置进行配对组合后的预测实体是否为事件论元进行预测,得到答案预测结果;根据该答案预测结果和对应的标签,输出事件论元。
基本信息
专利标题 :
对文本中的事件论元进行抽取的方法和电子设备
专利标题(英):
暂无
公开(公告)号 :
CN114297394A
申请号 :
CN202210238820.9
公开(公告)日 :
2022-04-08
申请日 :
2022-03-11
授权号 :
暂无
授权日 :
暂无
发明人 :
陶建华杨国花马文杰张大伟何佳毅
申请人 :
中国科学院自动化研究所
申请人地址 :
北京市海淀区中关村东路95号
代理机构 :
北京华夏泰和知识产权代理有限公司
代理人 :
李永叶
优先权 :
CN202210238820.9
主分类号 :
G06F16/35
IPC分类号 :
G06F16/35 G06F16/36
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06F
电数字数据处理
G06F16/35
••聚类;分类
法律状态
2022-04-08 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载