文本的标准化处理方法、装置、电子设备及计算机介质
公开
摘要

本公开涉及一种文本的标准化处理方法、装置、电子设备及计算机可读介质,属于数据处理技术领域。该方法包括:获取原始信息文本,原始信息文本中包括待处理的原始文本;根据预先生成的信息文本同义词典对原始信息文本进行匹配,得到原始信息文本中的原始文本对应的目标文本;对目标文本进行分词处理,得到目标文本中所包含的各个有效文本成分;获取预先生成的文本成分规则集合,并将各个有效文本成分中不属于文本成分规则集合的有效文本成分作为标准文本成分;根据标准文本成分得到原始文本对应的标准化文本。本公开通过信息文本同义词典和文本成分规则集合,对原始文本进行归一化处理得到标准化文本,可以提高文本归一化的效率和准确率。

基本信息
专利标题 :
文本的标准化处理方法、装置、电子设备及计算机介质
专利标题(英):
暂无
公开(公告)号 :
CN114613516A
申请号 :
CN202210267448.4
公开(公告)日 :
2022-06-10
申请日 :
2020-12-29
授权号 :
暂无
授权日 :
暂无
发明人 :
滕召荣刘斌郝东林
申请人 :
医渡云(北京)技术有限公司
申请人地址 :
北京市海淀区花园北路35号9号楼8层801
代理机构 :
北京律智知识产权代理有限公司
代理人 :
王辉
优先权 :
CN202210267448.4
主分类号 :
G16H50/80
IPC分类号 :
G16H50/80  G06F40/242  G06F40/247  G06F40/289  
IPC结构图谱
G
G部——物理
G16
特别适用于特定应用领域的信息通信技术
G16H
医疗保健信息学,即专门用于处置或处理医疗或健康数据的信息和通信技术
G16H50/00
专门适用于医疗诊断,医学模拟或医疗数据挖掘的ICT;专门适用于检测、监测或建模流行病或传染病
G16H50/80
用于检测、监测或模拟流行病或传染病,例如 流感
法律状态
2022-06-10 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332