文本向量生成方法、模型训练方法及相关装置
公开
摘要

本申请提供的文本向量生成方法、模型训练方法及相关装置中,对于获得的文本序列,文本处理设备将该文本序列的先验向量以及该文本序列的字向量、位置向量、段向量一起输入到文本向量模型的Bert层,使得该文本向量模型将文本序列的先验向量作为参考,从中获得文本序列中可能的词汇知识,用于将文本序列转换为文本向量。由于该先验向量携带有文本序列中词汇的先验信息,从而实现在不依赖于词典进行分词的情况下,通过该先验信息辅助文本向量模型对文本序列进行转换,获得文本序列更为准确的文本向量。

基本信息
专利标题 :
文本向量生成方法、模型训练方法及相关装置
专利标题(英):
暂无
公开(公告)号 :
CN114611511A
申请号 :
CN202210290851.9
公开(公告)日 :
2022-06-10
申请日 :
2022-03-23
授权号 :
暂无
授权日 :
暂无
发明人 :
罗欢张炫姚晓远未波波
申请人 :
上海喜马拉雅科技有限公司
申请人地址 :
上海市闵行区紫星路588号2幢2062室
代理机构 :
北京超凡宏宇专利代理事务所(特殊普通合伙)
代理人 :
张欣欣
优先权 :
CN202210290851.9
主分类号 :
G06F40/289
IPC分类号 :
G06F40/289  G06N3/04  G06N3/08  
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06F
电数字数据处理
G06F40/289
短语分析,例如有限状态技术或分块
法律状态
2022-06-10 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332