一种基于语义模板和语言模型的医疗文本分类方法

实质审查的生效

摘要

本发明公开了一种基于语义模板和语言模型的医疗文本分类方法，该方法包括以下步骤：S1：语料准备，通过公开来源获取医学相关语料；S2：训练语言模型，根据步骤S1中获取的语料，训练基于自注意力神经网络架构的语言模型；S3：设计语言模板；S4：分类任务训练；S5：输入待测文本进行结果预测，确认待测文本分类。在医疗审计的场景下，本发明能够将泛化能力强的基于大量非结构化数据的预训练模型语义模型应用在小数据甚至是零数据的场景，减少对标注数据的要求，避免过拟合。

基本信息

专利标题：

一种基于语义模板和语言模型的医疗文本分类方法

专利标题（英）：

暂无

公开（公告）号：

CN114357108A

申请号：

CN202111412869.3

公开（公告）日：

2022-04-15

申请日：

2021-11-25

授权号：

暂无

授权日：

暂无

发明人：

侯聪唐文瀚余海东肖茂许瑞玲王俊蔡冲夏凯陈佳林白良俊

申请人：

达而观数据（成都）有限公司

申请人地址：

四川省成都市天府新区湖畔路北段366号1栋3楼1号

代理机构：

上海智力专利商标事务所(普通合伙)

代理人：

周涛

优先权：

CN202111412869.3

主分类号：

G06F16/33

IPC分类号：

G06F16/33 G06F16/35 G06F16/951 G06F40/186 G06F40/247 G06F40/30 G16H50/70 G06N3/04 G06N3/08

IPC结构图谱

G部——物理

G06

计算；推算或计数

G06F

电数字数据处理

G06F16/33

••查询

法律状态

2022-05-03 ：

实质审查的生效

IPC(主分类) : G06F 16/33
申请日 : 20211125

2022-04-15 ：

公开

注：本法律状态信息仅供参考，即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。

文件下载

暂无PDF文件可下载