一种基于预加载权重词性组合的中文关键短语抽取的方法
实质审查的生效
摘要
本发明公开了一种基于预加载权重词性组合的中文关键短语抽取的方法,包括建立短语抽取模型,具体步骤如下:S1、对文本预处理;S2、建立核心抽取算法,所述核心抽取算法包括短语权重计算和制定短语拼接规则。该种基于预加载权重词性组合的中文关键短语抽取的方法,通过抽取出的关键短语,不仅能有效代表整个文档的核心内容,而且给出每个关键短语的语义权重,极大增强关键词抽取的可解释性,同时,通过基于中文语言习惯,设计关键短语的短语规则,可有效避免抽取出结构和语义错乱的内容。
基本信息
专利标题 :
一种基于预加载权重词性组合的中文关键短语抽取的方法
专利标题(英):
暂无
公开(公告)号 :
CN114490941A
申请号 :
CN202210100205.1
公开(公告)日 :
2022-05-13
申请日 :
2022-01-27
授权号 :
暂无
授权日 :
暂无
发明人 :
夏立钱柏丞周晶相若晨李颜戎杨学鑫
申请人 :
南京烽火天地通信科技有限公司
申请人地址 :
江苏省南京市江宁区滨江经济开发区盛安大道739号
代理机构 :
南京经纬专利商标代理有限公司
代理人 :
陆志斌
优先权 :
CN202210100205.1
主分类号 :
G06F16/33
IPC分类号 :
G06F16/33 G06F40/289 G06F40/30
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06F
电数字数据处理
G06F16/33
••查询
法律状态
2022-05-31 :
实质审查的生效
IPC(主分类) : G06F 16/33
申请日 : 20220127
申请日 : 20220127
2022-05-13 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载