一种基于课程学习的文本实体识别方法
公开
摘要

本发明提供了一种基于课程学习的文本实体识别方法,包括将构建的文本标注数据集划分为训练集、验证集和测试集;将训练集中的文本数据按照从易到难的顺序进行排列,通过自然断点分类算法将排序后的训练集中的文本数据划分为n个区块;使实体识别模型对训练集中n个区块的文本数据进行课程学习,直至模型收敛;学习训练过程中将实体识别模型在验证集上进行评估,获取最优模型参数设置;将符合训练效果的实体识别模型应用于真实项目文本实体识别场景中。本发明通过使实体识别模型进行课程学习,训练时模型对局部极小值的跟踪会引导其走向更优的参数空间,更有可能逼近全局最小值,使其具有更好的泛化性,从而达到提升训练效率和识别准确度的效果。

基本信息
专利标题 :
一种基于课程学习的文本实体识别方法
专利标题(英):
暂无
公开(公告)号 :
CN114595691A
申请号 :
CN202210210099.2
公开(公告)日 :
2022-06-07
申请日 :
2022-03-04
授权号 :
暂无
授权日 :
暂无
发明人 :
石路云张祖平
申请人 :
中南大学
申请人地址 :
湖南省长沙市岳麓区麓山南路932号
代理机构 :
长沙七源专利代理事务所(普通合伙)
代理人 :
张勇
优先权 :
CN202210210099.2
主分类号 :
G06F40/295
IPC分类号 :
G06F40/295  G06F40/216  G06K9/62  G06N3/04  G06N3/08  
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06F
电数字数据处理
G06F40/295
命名实体识别
法律状态
2022-06-07 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332