一种适合复杂异构系统的HPL矩阵更新优化方法
授权
摘要

本发明公开了一种适合复杂异构系统的HPL矩阵更新优化方法,其特征在于,对HPL矩阵更新的行交换进行优化:在执行HPL的第一分段行交换完成、上一次循环矩阵更新和当前进程接收到下一次循环的行交换信息之后,执行第一分段的下一次循环的行交换。对Long行交换通信方法优化,将spread过程接收缓冲与roll过程发送缓冲分离,当前行进程执行roll过程前,将数据拷贝到roll发送缓冲区;在roll过程执行网络传输的同时,将spread所需的数据传输到MPI发送缓冲区;roll执行完成MPI网络通信后,开启执行spread过程,同时把roll接收的数据异步传输到GPU。本发明能够充分发挥GPU的计算能力。

基本信息
专利标题 :
一种适合复杂异构系统的HPL矩阵更新优化方法
专利标题(英):
暂无
公开(公告)号 :
CN111913748A
申请号 :
CN202010669721.7
公开(公告)日 :
2020-11-10
申请日 :
2020-07-13
授权号 :
CN111913748B
授权日 :
2022-05-24
发明人 :
黎雷生马文静赵海涛孙家昶李会元
申请人 :
中国科学院软件研究所
申请人地址 :
北京市海淀区中关村南四街4号
代理机构 :
北京君尚知识产权代理有限公司
代理人 :
司立彬
优先权 :
CN202010669721.7
主分类号 :
G06F9/38
IPC分类号 :
G06F9/38  
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06F
电数字数据处理
G06F9/00
程序控制装置,例如,控制单元
G06F9/06
应用存入的程序的,即应用处理设备的内部存储来接收程序并保持程序的
G06F9/30
与执行机器指令相关的设计,例如指令译码
G06F9/38
并行执行指令的,例如,流水线、超前锁定
法律状态
2022-05-24 :
授权
2020-11-27 :
实质审查的生效
IPC(主分类) : G06F 9/38
申请日 : 20200713
2020-11-10 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332