基于通信操作稀疏化的分布式深度学习多步延迟更新方法

授权

摘要

本发明公开了一种基于通信操作稀疏化的分布式深度学习多步延迟更新方法，其具体步骤包括：热身训练，在进行多步延迟迭代训练前利用同步随机梯度下降方法对深度学习模型进行一定迭代次数的训练；切换阶段，其目的是为了将同步随机梯度下降更新方法切换为多步延迟训练模式；本地参数更新操作采用基于全局梯度的本地更新方法，目的是为了缓解权重延迟，保证模型的收敛精度；多步延迟训练，其具体包括全局参数更新、本地参数更新和通信操作稀疏化三个步骤。本发明通过采用通信操作稀疏化，减缓了网络拥塞，消除了同步开销，很大程度降低了分布式训练过程中的通信开销，优化了训练过程的通信开销。

基本信息

专利标题：

基于通信操作稀疏化的分布式深度学习多步延迟更新方法

专利标题（英）：

暂无

公开（公告）号：

CN112463189A

申请号：

CN202011312697.8

公开（公告）日：

2021-03-09

申请日：

2020-11-20

授权号：

CN112463189B

授权日：

2022-04-22

发明人：

董德尊徐叶茂徐炜遐廖湘科

申请人：

中国人民解放军国防科技大学

申请人地址：

湖南省长沙市开福区德雅路109号

代理机构：

北京丰浩知识产权代理事务所(普通合伙)

代理人：

董超

优先权：

CN202011312697.8

主分类号：

G06F8/65

IPC分类号：

G06F8/65 G06N3/04 G06N3/063 G06N3/08

IPC结构图谱

G部——物理

G06

计算；推算或计数

G06F

电数字数据处理

G06F8/00

软件工程设计

G06F8/60

软件部署

G06F8/65

更新

法律状态

2022-04-22 ：

授权

2021-03-26 ：

实质审查的生效

IPC(主分类) : G06F 8/65
申请日 : 20201120

2021-03-09 ：

公开

注：本法律状态信息仅供参考，即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。

文件下载

暂无PDF文件可下载