一种基于GPU的N体模拟程序性能优化方法
授权
摘要
本发明涉及一种基于GPU的N体模拟程序性能优化方法,包括以下步骤:将相关索引信息传入到GPU使得构造短程力列表的过程迁移到GPU上,同时使得构造列表的过程并行化;改变线程块调度的方式,通过GPU的流水调度,将粒子信息轮流加载到GPU的共享内存中;在GPU核心函数中采用插值多项式和混合精度计算短程作用力,CPU上计算好插值常数后传入GPU,存放在GPU的共享内存中;对GPU上各粒子的短程力计算结果通过重排序,再GPU全局内存进行规约合并,在所有粒子计算完成后再将最终结果传回CPU。本发明减少了从CPU内存到GPU显存的数据传输,降低重复访存的延迟,提高GPU计算短程力过程中的数据存取效率,以及减少从GPU显存到CPU内存数据传输,同时也减少了CPU端信息更新的时间。
基本信息
专利标题 :
一种基于GPU的N体模拟程序性能优化方法
专利标题(英):
暂无
公开(公告)号 :
CN112765870A
申请号 :
CN202110077894.4
公开(公告)日 :
2021-05-07
申请日 :
2021-01-20
授权号 :
CN112765870B
授权日 :
2022-05-06
发明人 :
王武赵文龙
申请人 :
中国科学院计算机网络信息中心
申请人地址 :
北京市海淀区中关村南四街4号院内2号楼
代理机构 :
北京亿腾知识产权代理事务所(普通合伙)
代理人 :
陈霁
优先权 :
CN202110077894.4
主分类号 :
G06F30/25
IPC分类号 :
G06F30/25 G06F119/14
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06F
电数字数据处理
G06F30/25
使用基于粒子的方法
法律状态
2022-05-06 :
授权
2021-05-25 :
实质审查的生效
IPC(主分类) : G06F 30/25
申请日 : 20210120
申请日 : 20210120
2021-05-07 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载