语言表示模型系统、预训练方法、装置、设备及介质
授权
摘要
本公开实施例公开了一种语言表示模型系统、语言表示模型的预训练方法、自然语言处理方法、装置、设备及介质,所述语言表示模型系统包括:以字为分词单位的字粒度语言表示子模型和以词为分词单位的词粒度语言表示子模型;其中,字粒度语言表示子模型用于基于以字为分词单位的语句输出每个分字在所述语句中所表达的语义对应的第一语义向量;词粒度语言表示子模型用于基于以词为分词单位的所述语句输出每个分词在所述语句中所表达的语义对应的第二语义向量。本公开实施例的技术方案,提供了一种混合粒度语言表示模型,为下游自然语言处理任务提供了模型基础,有助于提升下游自然语言处理任务的处理精度,提升了语言表示模型的迁移效果。
基本信息
专利标题 :
语言表示模型系统、预训练方法、装置、设备及介质
专利标题(英):
暂无
公开(公告)号 :
CN111914551A
申请号 :
CN202010746066.0
公开(公告)日 :
2020-11-10
申请日 :
2020-07-29
授权号 :
CN111914551B
授权日 :
2022-05-20
发明人 :
张新松李鹏帅李航
申请人 :
北京字节跳动网络技术有限公司
申请人地址 :
北京市石景山区实兴大街30号院3号楼2层B-0035房间
代理机构 :
北京远智汇知识产权代理有限公司
代理人 :
范坤坤
优先权 :
CN202010746066.0
主分类号 :
G06F40/289
IPC分类号 :
G06F40/289 G06F40/205 G06F40/30 G06F16/35
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06F
电数字数据处理
G06F40/289
短语分析,例如有限状态技术或分块
法律状态
2022-05-20 :
授权
2020-11-27 :
实质审查的生效
IPC(主分类) : G06F 40/289
申请日 : 20200729
申请日 : 20200729
2020-11-10 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载