游记数据自动提取的方法、电子设备和介质
公开
摘要

本发明公开了一种游记数据自动提取的方法、电子设备及介质,其中游记数据自动提取的方法包括S100、对待处理文本进行分词和命名体识别,得到多个分词和多个命名体;S200、基于目的地字典表从多个分词中筛选出候选目的地,和,基于语料库从多个命名体中筛选出候选目的地;S300、若所述候选目的地的数量大于预设值,对所有候选目的地进行聚类,得到多个聚类簇;S400、将聚类元素最多的聚类簇对应的候选目的地作为最终的目的地。本发明通过游记数据自动提取的方法,实现了对用户游记中提到的目的地和POI精准识别,提高游记关键词的识别精确性。

基本信息
专利标题 :
游记数据自动提取的方法、电子设备和介质
专利标题(英):
暂无
公开(公告)号 :
CN114298045A
申请号 :
CN202111626090.1
公开(公告)日 :
2022-04-08
申请日 :
2021-12-28
授权号 :
暂无
授权日 :
暂无
发明人 :
刘桐桐陈剑明
申请人 :
携程旅游网络技术(上海)有限公司
申请人地址 :
上海市长宁区福泉路99号
代理机构 :
上海弼兴律师事务所
代理人 :
林嵩
优先权 :
CN202111626090.1
主分类号 :
G06F40/295
IPC分类号 :
G06F40/295  G06F40/289  G06F40/268  G06F40/237  G06F16/36  G06F16/35  G06K9/62  
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06F
电数字数据处理
G06F40/295
命名实体识别
法律状态
2022-04-08 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332