预训练字符模型及字音转换神经网络模型
实质审查的生效
摘要
本发明公开了一种预训练字符模型及字音转换神经网络模型,预训练字符模型包括:字符嵌入层、若干自注意力层和线性层;其中,所述字符嵌入层设有输入端和输出端,所述输入端用于输入含掩码的单词对应的字符序列,所述输出端与各自注意力层依次连接,最后一层的自注意力层与所述线性层连接。字音转换神经网络模型为基于预训练字符模型构成的微调预训练字符模型的字音转换神经网络模型与基于注意力机制嵌入预训练字符特征的字音转换神经网络模型。本发明通过在无标签的词表数据上面使用掩码字符任务进行预训练得到预训练字符模型,与下游的字音转换神经网络的解码器配合,能够通过获取代价低的无标签词表降低多语言字音转换错误率。
基本信息
专利标题 :
预训练字符模型及字音转换神经网络模型
专利标题(英):
暂无
公开(公告)号 :
CN114548406A
申请号 :
CN202210178595.4
公开(公告)日 :
2022-05-27
申请日 :
2022-02-24
授权号 :
暂无
授权日 :
暂无
发明人 :
董璐凌震华
申请人 :
中国科学技术大学
申请人地址 :
安徽省合肥市包河区金寨路96号
代理机构 :
北京凯特来知识产权代理有限公司
代理人 :
郑立明
优先权 :
CN202210178595.4
主分类号 :
G06N3/08
IPC分类号 :
G06N3/08 G06N3/04 G10L15/16
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06N
基于特定计算模型的计算机系统
G06N3/00
基于生物学模型的计算机系统
G06N3/02
采用神经网络模型
G06N3/08
学习方法
法律状态
2022-06-14 :
实质审查的生效
IPC(主分类) : G06N 3/08
申请日 : 20220224
申请日 : 20220224
2022-05-27 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载