一种基于文本信息的数据检索方法
公开
摘要
本发明公开了一种基于文本信息的数据检索方法,包括以下步骤:S1、输入检索信息;S2、对输入的检索信息进行预处理;S3、消歧并提取关键字;S4、收集词段;S5、词段预处理;S6、对所述词段进行拆分和分集;S7、对拆分和分集之后的词段中出现检索信息的情况进行词频统计,并按照所述词频数量将词段聚类成多个信息集;S8、按照词频数量对所述信息集进行排列;S9、按照检索信息对应文本字符数,由高到低排布所述词段;S10、将词段信息展示给用户。本发明采用对检索内容先进行消歧减少检索时不必要的算力浪费,同时在前端减少不必要的检索错误,同时经过词频统计进行信息检索,简化检索过程,实现双向的快速准确的对比,增加准确性和实效性。
基本信息
专利标题 :
一种基于文本信息的数据检索方法
专利标题(英):
暂无
公开(公告)号 :
CN114625852A
申请号 :
CN202210241494.7
公开(公告)日 :
2022-06-14
申请日 :
2022-03-11
授权号 :
暂无
授权日 :
暂无
发明人 :
高献辰
申请人 :
北京企名片科技有限公司
申请人地址 :
北京市海淀区成府路28号10层4-1012
代理机构 :
北京巨弘知识产权代理事务所(普通合伙)
代理人 :
张婧
优先权 :
CN202210241494.7
主分类号 :
G06F16/332
IPC分类号 :
G06F16/332 G06F16/33 G06F16/35
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06F
电数字数据处理
G06F16/332
•••查询公式
法律状态
2022-06-14 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载