一种NLP文本安全审核多级检索系统
公开
摘要

本发明公开了一种NLP文本安全审核多级检索系统,利用压缩前缀树的数据结构进行数据的存储和查找,查询速度快,且内存占用比使用字典树数据结构降低了两千多倍,关键词匹配子模块、句子相似度匹配子模块和文本分类深度学习子模块构成三级搜索的层级搜索结构,查询准确率高,既能覆盖到显性敏感词的搜索,同时能从语义上进行文本内容安全审核,在准确率、容错率以及覆盖率上都有保障,又能提高系统的模型泛化能力,解决了现有的NLP文本安全审核系统使用Trie树的数据结构进行存储,占用存储空间大,增加了服务器的内存成本,不便于在同一台服务器上大规模部署,在性能上难以达到最优,以及模型泛化能力受限制,预测准确性不稳定的技术问题的技术问题。

基本信息
专利标题 :
一种NLP文本安全审核多级检索系统
专利标题(英):
暂无
公开(公告)号 :
CN114579693A
申请号 :
CN202111473148.3
公开(公告)日 :
2022-06-03
申请日 :
2021-12-02
授权号 :
暂无
授权日 :
暂无
发明人 :
曾锐鸿马金龙熊佳王伟喆吴文亮罗箫盘子圣焦南凯黎子骏徐志坚谢睿陈光尧
申请人 :
广州趣丸网络科技有限公司
申请人地址 :
广东省广州市天河区平云路163号之二1601室(部位:自编之01室)(仅限办公)
代理机构 :
北京集佳知识产权代理有限公司
代理人 :
李秋梅
优先权 :
CN202111473148.3
主分类号 :
G06F16/33
IPC分类号 :
G06F16/33  G06F16/35  G06F40/211  G06F40/284  G06F40/289  G06F40/30  G06K9/62  
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06F
电数字数据处理
G06F16/33
••查询
法律状态
2022-06-03 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332