自然语言处理方法、装置及计算机设备
实质审查的生效
摘要
本申请公开了一种自然语言处理方法、装置及计算机设备,涉及人工智能技术领域,可解决针对不同的自然语言处理任务,需要量身定做相应的模型,同时进行各种“魔改”,导致任务处理效率低、成本高,且通用领域模型表征能力有限,在垂直下游任务中拟合能力较差的技术问题。其中方法包括:根据预设训练任务对通用领域下的BERT模型进行增量预训练,得到自然语言处理模型,其中,预设训练任务包括字词级别的第一训练任务和任务级别的第二训练任务;获取待进行自然语言处理的文本数据,并对文本数据进行预处理,其中,预处理包括数据清洗处理、停用词滤除处理中的至少一种;将预处理后的文本数据输入自然语言处理模型中,获取自然语言处理结果。
基本信息
专利标题 :
自然语言处理方法、装置及计算机设备
专利标题(英):
暂无
公开(公告)号 :
CN114528919A
申请号 :
CN202210044925.0
公开(公告)日 :
2022-05-24
申请日 :
2022-01-14
授权号 :
暂无
授权日 :
暂无
发明人 :
侯盼盼黄明星王福钋张航飞徐华韫曹富康沈鹏
申请人 :
北京健康之家科技有限公司
申请人地址 :
北京市朝阳区利泽中二路2号C座2层201
代理机构 :
北京中强智尚知识产权代理有限公司
代理人 :
刘敏
优先权 :
CN202210044925.0
主分类号 :
G06K9/62
IPC分类号 :
G06K9/62 G06F40/289 G06F40/295 G06F40/30
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06K
数据识别;数据表示;记录载体;记录载体的处理
G06K9/00
用于阅读或识别印刷或书写字符或者用于识别图形,例如,指纹的方法或装置
G06K9/62
应用电子设备进行识别的方法或装置
法律状态
2022-06-10 :
实质审查的生效
IPC(主分类) : G06K 9/62
申请日 : 20220114
申请日 : 20220114
2022-05-24 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载