一种通用文本内容挖掘方法、装置、服务器及存储介质
授权
摘要

本发明实施例公开了一种通用文本内容挖掘方法、装置、服务器及存储介质。其中,该方法包括:获取包含目标实体以及目标特征的问题;将所述目标实体、所述目标特征以及目标文本输入预先构建的答案预测模型中,通过所述答案预测模型确定问题的答案在所述目标文本中的起始位置和结束位置,其中所述答案预测模型是预先依据包含样本实体和样本特征的样本问题以及样本答案在文本中的起始位置和结束位置训练得到的。本发明实施例提供的技术方案,可以准确预测出答案在目标文本中的起始位置和结束位置,增加了答案识别准确率,同时,由于加入了知识库特征,可以提高从文本内容中抽取问题答案的准确性。

基本信息
专利标题 :
一种通用文本内容挖掘方法、装置、服务器及存储介质
专利标题(英):
暂无
公开(公告)号 :
CN108052577A
申请号 :
CN201711297664.9
公开(公告)日 :
2018-05-18
申请日 :
2017-12-08
授权号 :
CN108052577B
授权日 :
2022-06-14
发明人 :
杨仁凯王浩李莹张一麟
申请人 :
北京百度网讯科技有限公司
申请人地址 :
北京市海淀区上地十街10号百度大厦2层
代理机构 :
北京品源专利代理有限公司
代理人 :
孟金喆
优先权 :
CN201711297664.9
主分类号 :
G06F17/30
IPC分类号 :
G06F17/30  G06N3/08  G06N3/04  
法律状态
2022-06-14 :
授权
2018-06-12 :
实质审查的生效
IPC(主分类) : G06F 17/30
申请日 : 20171208
2018-05-18 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332