一种基于GPU的N体模拟程序性能优化方法

授权

摘要

本发明涉及一种基于GPU的N体模拟程序性能优化方法，包括以下步骤：将相关索引信息传入到GPU使得构造短程力列表的过程迁移到GPU上，同时使得构造列表的过程并行化；改变线程块调度的方式，通过GPU的流水调度，将粒子信息轮流加载到GPU的共享内存中；在GPU核心函数中采用插值多项式和混合精度计算短程作用力，CPU上计算好插值常数后传入GPU，存放在GPU的共享内存中；对GPU上各粒子的短程力计算结果通过重排序，再GPU全局内存进行规约合并，在所有粒子计算完成后再将最终结果传回CPU。本发明减少了从CPU内存到GPU显存的数据传输，降低重复访存的延迟，提高GPU计算短程力过程中的数据存取效率，以及减少从GPU显存到CPU内存数据传输，同时也减少了CPU端信息更新的时间。

基本信息

专利标题：

一种基于GPU的N体模拟程序性能优化方法

专利标题（英）：

暂无

公开（公告）号：

CN112765870A

申请号：

CN202110077894.4

公开（公告）日：

2021-05-07

申请日：

2021-01-20

授权号：

CN112765870B

授权日：

2022-05-06

发明人：

王武赵文龙

申请人：

中国科学院计算机网络信息中心

申请人地址：

北京市海淀区中关村南四街4号院内2号楼

代理机构：

北京亿腾知识产权代理事务所(普通合伙)

代理人：

陈霁

优先权：

CN202110077894.4

主分类号：

G06F30/25

IPC分类号：

G06F30/25 G06F119/14

IPC结构图谱

G部——物理

G06

计算；推算或计数

G06F

电数字数据处理

G06F30/25

使用基于粒子的方法

法律状态

2022-05-06 ：

授权

2021-05-25 ：

实质审查的生效

IPC(主分类) : G06F 30/25
申请日 : 20210120

2021-05-07 ：

公开

注：本法律状态信息仅供参考，即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。

文件下载

暂无PDF文件可下载