一种基于深度学习的中文电子病历文本语义分割方法

实质审查的生效

摘要

本发明公开了一种基于深度学习的中文电子病历文本语义分割方法，主要包括语义字典构建及文本语义特征向量表示、整体特征融合、深度神经网络训练以及预测优化部分。利用预训练语言模型表示文本上下文语义特征，并加入了字符语义位置特征，将融合后的整体特征输入到深度神经网络中进行模型训练。相比于现有的语义分割技术，本发明构建字符间融合全局的上下文语义特征，捕获并学习序列每个字符的语义类别特性，最后找到每个字符的最佳语义类别标签，从而实现精细化的文本语义分割，在数据集较小情况下实现了文本语义分割较高的准确性，发展了EMR文本语义分割的新方法。

基本信息

专利标题：

一种基于深度学习的中文电子病历文本语义分割方法

专利标题（英）：

暂无

公开（公告）号：

CN114417836A

申请号：

CN202210052863.8

公开（公告）日：

2022-04-29

申请日：

2022-01-18

授权号：

暂无

授权日：

暂无

发明人：

艾彭磊杜金莲金雪云张潇张津丽

申请人：

北京工业大学

申请人地址：

北京市朝阳区平乐园100号

代理机构：

北京思海天达知识产权代理有限公司

代理人：

沈波

优先权：

CN202210052863.8

主分类号：

G06F40/242

IPC分类号：

G06F40/242 G06F40/30 G16H10/60 G06N3/04

IPC结构图谱

G部——物理

G06

计算；推算或计数

G06F

电数字数据处理

G06F40/242

词典

法律状态

2022-05-20 ：

实质审查的生效

IPC(主分类) : G06F 40/242
申请日 : 20220118

2022-04-29 ：

公开

注：本法律状态信息仅供参考，即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。

文件下载

暂无PDF文件可下载