用于点击率预测的基于图的大规模embedding模型训练...
实质审查的生效
摘要

本发明公布了一种用于点击率预测的基于图的大规模embedding模型训练方法及系统,系统包括密集参数模块和客户端模块,采用混合通信架构,将点击率预测输入数据集分配给不同工作节点,每个工作节点维护一个客户端,本地模型参数均直接存储在GPU内存中;每个工作节点均持有模型参数副本,并在训练时进行同步。本发明采用Embedding模型参数表示点击率预测输入数据对应类别特征值的重要性,将点击率预测数据和embedding模型向量表示为二元图模型,利用图局部性和度数偏斜特性执行模型并行训练;设计基于图的分区和有界同步,提高训练大型embedding模型的可扩展性和并行计算效率。

基本信息
专利标题 :
用于点击率预测的基于图的大规模embedding模型训练方法及系统
专利标题(英):
暂无
公开(公告)号 :
CN114358859A
申请号 :
CN202210277082.9
公开(公告)日 :
2022-04-15
申请日 :
2022-03-21
授权号 :
暂无
授权日 :
暂无
发明人 :
崔斌苗旭鹏梁宇轩石屹宁张海林
申请人 :
北京大学
申请人地址 :
北京市海淀区颐和园路5号
代理机构 :
北京万象新悦知识产权代理有限公司
代理人 :
黄凤茹
优先权 :
CN202210277082.9
主分类号 :
G06Q30/02
IPC分类号 :
G06Q30/02  G06Q10/04  G06N3/04  G06N3/08  
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06Q
专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q30/00
商业,例如购物或电子商务
G06Q30/02
行销,例如,市场研究与分析、调查、促销、广告、买方剖析研究、客户管理或奖励;价格评估或确定
法律状态
2022-05-03 :
实质审查的生效
IPC(主分类) : G06Q 30/02
申请日 : 20220321
2022-04-15 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332