模型训练方法、中文拼写纠错方法以及检索方法
实质审查的生效
摘要
提供一种模型训练方法和中文拼写纠错方法。该模型训练方法包括:将句子样本输入给嵌入层,以得到句子样本的每个汉字的字向量;基于句子样本的每个汉字的字向量得到多个含有句子信息的字向量;将多个含有句子信息的字向量输入给分类层,分类层将每个含有句子信息的字向量分别与权重参数矩阵中的每个一维向量进行相乘,以得到多个分值;对于句子样本中的每个汉字,采用其得到的多个分值中最大分值对应的汉字作为其纠错汉字;利用正确纠错汉字和错误纠错汉字之间的损失调整权重参数矩阵,并进而利用反向传播算法调整产生权重参数矩阵的指定模型的相应层的权重参数。通过该方法,利用动态产生的混淆集进一步区分字与字之间在相似程度上的差异。
基本信息
专利标题 :
模型训练方法、中文拼写纠错方法以及检索方法
专利标题(英):
暂无
公开(公告)号 :
CN114417833A
申请号 :
CN202111573883.1
公开(公告)日 :
2022-04-29
申请日 :
2021-12-21
授权号 :
暂无
授权日 :
暂无
发明人 :
章波李辰包祖贻张月曹俊杰
申请人 :
阿里巴巴(中国)有限公司
申请人地址 :
浙江省杭州市滨江区长河街道网商路699号4号楼5楼508室
代理机构 :
北京成创同维知识产权代理有限公司
代理人 :
刘静
优先权 :
CN202111573883.1
主分类号 :
G06F40/232
IPC分类号 :
G06F40/232 G06N3/08
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06F
电数字数据处理
G06F40/232
拼写校正,例如拼写差错程序或加元音符
法律状态
2022-05-20 :
实质审查的生效
IPC(主分类) : G06F 40/232
申请日 : 20211221
申请日 : 20211221
2022-04-29 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载