基于推理、高置信度、遗传迭代的新词发现算法
实质审查的生效
摘要

本发明提出了一种基于推理、高置信度、遗传迭代的新词发现算法。本发明提出了用推理方式替代组合穷举方式产生候选新词,将新词候选集从超巨大稀疏空间,降低了到数十万的量级,使得现有的计算和存储资源从不可处理,变成可以处理;本发明提出了具有归一化性质的置信度指标,可以很好地定义置信度阈值,给出高质量的候选新词,大大提高人工编辑的工作效率。本发明提出了高置信度遗传迭代流程,每一个迭代周期,只把置信度高的,并且人工审核通过的新词加入到词典中,分阶段逐步提高词典覆盖率,直至100%的目标。本发明提出了一个技术方案关于上述新词发现算法的分布式计算技术架构实现方法,其专业化分工、风险分散和独立管理的设计原理,可以提高系统整体稳定性和调度性能。

基本信息
专利标题 :
基于推理、高置信度、遗传迭代的新词发现算法
专利标题(英):
暂无
公开(公告)号 :
CN114417848A
申请号 :
CN202111639010.6
公开(公告)日 :
2022-04-29
申请日 :
2021-12-29
授权号 :
暂无
授权日 :
暂无
发明人 :
罗伟杰
申请人 :
东方财富信息股份有限公司
申请人地址 :
上海市徐汇区宛平南路88号金座28F
代理机构 :
上海申汇专利代理有限公司
代理人 :
翁若莹
优先权 :
CN202111639010.6
主分类号 :
G06F40/284
IPC分类号 :
G06F40/284  G06F40/242  G06F40/216  
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06F
电数字数据处理
G06F40/284
词汇分析,例如标记或搭配词
法律状态
2022-05-20 :
实质审查的生效
IPC(主分类) : G06F 40/284
申请日 : 20211229
2022-04-29 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332