基于hash存储的网络词汇语义分析方法和系统
授权
摘要
本发明提供了一种基于Hash存储的网络词汇语义分析方法和系统,收集网络词汇,对所收集的网络词汇,收集对应的传统词汇,依据所述网络词汇、传统词汇的一一对应关系建立(key,value)对,其中key为网络词汇,value为传统词汇;确定Hash函数,将所述(key,value)对根据Hash函数计算得出Hash函数值,按所述Hash函数值、所述(key,value)对存储在Hash链表中;在Hash链表中查找所述网络词汇,并转化为传统词汇;依据上下文的语义结构,结合贝叶斯定律,修正词汇语义的二义性,判定所述词汇是否是网络词汇。针对社交短文本中存在的大量网络用语现象,快速准确定位社交短文本中的网络用语。
基本信息
专利标题 :
基于hash存储的网络词汇语义分析方法和系统
专利标题(英):
暂无
公开(公告)号 :
CN109145297A
申请号 :
CN201810917995.6
公开(公告)日 :
2019-01-04
申请日 :
2018-08-13
授权号 :
CN109145297B
授权日 :
2022-06-10
发明人 :
张楠谢彬李程刘立佘平
申请人 :
华东计算技术研究所(中国电子科技集团公司第三十二研究所)
申请人地址 :
上海市嘉定区嘉罗路1485号
代理机构 :
上海段和段律师事务所
代理人 :
李佳俊
优先权 :
CN201810917995.6
主分类号 :
G06F17/27
IPC分类号 :
G06F17/27 G06F16/901 G06F16/13
法律状态
2022-06-10 :
授权
2019-01-29 :
实质审查的生效
IPC(主分类) : G06F 17/27
申请日 : 20180813
申请日 : 20180813
2019-01-04 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载