一种基于实体识别的试题自动录入方法
实质审查的生效
摘要
本发明涉及数据处理技术领域,且公开了一种基于实体识别的试题自动录入方法,包括以下步骤:文档类型判断、文档预处理、数据集的构建、试题的实体识别模型、完整性检查以及试题分割录入;第一步;文档类型判断:首先判断读取的试题文档类型,如果是TXT类型文档直接进入试题的实体识别模型。如果是Word类型试题文档则需要进行文档预处;第二步;文档预处理:其次由于Word文档中包含有很多的富文本信息,如图片、表格、公式和字体样式(加粗、倾斜、下划线)等内容。本发明通过将试题的分割录入,转换成试题的实体识别问题,并应用深度学习技术,提高了试题自动录入的准确率,并且对不同类型的试题录入具有较好的泛化能力。
基本信息
专利标题 :
一种基于实体识别的试题自动录入方法
专利标题(英):
暂无
公开(公告)号 :
CN114444474A
申请号 :
CN202011220683.3
公开(公告)日 :
2022-05-06
申请日 :
2020-11-05
授权号 :
暂无
授权日 :
暂无
发明人 :
杨立春赵梦凯夏德虎张志发巩稼民蒋杰伟张凯泽
申请人 :
深圳市企鹅网络科技有限公司;西安邮电大学
申请人地址 :
广东省深圳市南山区西丽街道松坪山社区松坪山朗山路16号华瀚创新园办公楼D座6楼
代理机构 :
深圳市创富知识产权代理有限公司
代理人 :
高红
优先权 :
CN202011220683.3
主分类号 :
G06F40/216
IPC分类号 :
G06F40/216 G06F40/295
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06F
电数字数据处理
G06F40/216
使用统计方法
法律状态
2022-05-24 :
实质审查的生效
IPC(主分类) : G06F 40/216
申请日 : 20201105
申请日 : 20201105
2022-05-06 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载