日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

首頁在售求購查詢申請展會資訊專利榜企服商城升級VIP

立即登錄免費注冊

在售專利
求購專利
查詢專利
新聞資訊
技術展會
招商加盟
專利榜

本網專利代理業務由天津創信方達專利代理事務所(普通合伙)承接機構代碼：12247 本網專利代理業務由天津創信方達專利代理事務所(普通合伙)承接機構代碼：12247 本網專利代理業務由天津創信方達專利代理事務所(普通合伙)承接機構代碼：12247

本網專利代理業務由天津創信方達專利代理事務所(普通合伙)承接機構代碼：12247 本網專利代理業務由天津創信方達專利代理事務所(普通合伙)承接機構代碼：12247 本網專利代理業務由天津創信方達專利代理事務所(普通合伙)承接機構代碼：12247

[發明專利]一種基于GPU的N體模擬程序性能優化方法有效

申請號：	202110077894.4	申請日：	2021-01-20
公開（公告）號：	CN112765870B	公開（公告）日：	2022-05-06
發明（設計）人：	王武;趙文龍	申請（專利權）人：	中國科學院計算機網絡信息中心
主分類號：	G06F30/25	分類號：	G06F30/25;G06F119/14
代理公司：	北京億騰知識產權代理事務所(普通合伙) 11309	代理人：	陳霽
地址：	100190 北京市***	國省代碼：	北京;11
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	一種基于 gpu 模擬程序性能優化方法
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【權利要求書】：

1.一種基于GPU的N體模擬程序性能優化方法，其特征在于，包括以下步驟：

將相關索引信息傳入到GPU使得構造短程力列表的過程遷移到GPU上，同時使得構造列表的過程并行化；

改變線程塊調度的方式，通過GPU的流水調度，將粒子信息輪流加載到GPU的共享內存中；

在GPU核心函數中采用插值多項式和混合精度計算短程作用力，CPU上計算好插值常數后傳入GPU，存放在GPU的共享內存中；

對GPU上各粒子的短程力計算結果通過重排序，在GPU全局內存對同一粒子的加速度進行規約合并，在所有粒子計算完成后再將最終結果傳回CPU；

所述將相關索引信息傳入到GPU使得構造短程力列表的過程遷移到GPU上，同時使得構造列表的過程并行化步驟，包括：

在GPU顯存中分配短程力計算中所需求的target列表、source列表以及相關數組所需的顯存空間；

CPU端將預處理得到的具體粒子信息所需要的索引信息、每個包的粒子對應的索引數組以及在顯存中存儲的偏移量，傳入到顯存中；

GPU端單獨使用一個核函數，使每個線程處理單獨一個包，根據CPU端傳入的索引信息在顯存中已經存在的所有粒子的信息進行索引，得到對應包的粒子；以及根據各自包的偏移量進行存儲，生成所述target列表和所述source列表；

所述對GPU上各粒子的短程力計算結果通過重排序，在GPU全局內存對同一粒子的加速度進行規約合并，在所有粒子計算完成后再將最終結果傳回CPU步驟，包括：

在GPU端分配數組acc，保存進程所有粒子的加速度；

在每次P2P計算的過程中，將每個線程計算后的加速度在顯存所存儲的target_acc列表進行重排序，使得擁有相同粒子編號的部分規約到同一存儲地址；

使用一個核函數對重排序的列表進行規約，使每個線程統計一個粒子加速度，獲得每個粒子在這次計算中最終的加速度，再更新到acc數組中，一直在顯存中保存該數組到最后一批粒子計算完短程力；

在分批計算完所有粒子的P2P相關計算之后，最后一批粒子計算結束時將acc數組從顯存傳回到CPU內存，將CPU端的粒子信息進行更新。

2.根據權利要求1所述的優化方法，其特征在于，所述改變線程塊調度的方式，通過GPU的流水調度，將粒子信息輪流加載到GPU的共享內存中步驟，包括：

在GPU端分配數組acc，保存該進程所有粒子的加速度；

由一個GPU中的一個線程塊計算target列表中相同target包中的粒子，每個包只使用一個線程塊，其中的線程分批輪流加載不同的target粒子；或使每個包用一個或多個線程塊，每個線程計算這個包中的一個target粒子，每個新的包用新的線程塊，多余的線程空閑；

將部分source列表中的相關粒子加載到共享內存；

計算當前線程代表的target粒子與共享內存中的source粒子的相互作用；

加載新的source粒子到共享內存繼續計算，直到相互作用列表中所有source粒子的acc計算完成。

3.根據權利要求1所述的優化方法，其特征在于，所述在GPU核心函數中采用插值多項式和混合精度計算短程作用力，CPU上計算好插值常數后傳入GPU，存放在GPU的共享內存中步驟，包括：

對于GPU端的計算，有在除法中使用到的常數，在CPU端計算好，然后將其倒數作為常數傳入GPU，在GPU端進行乘法運算。

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于中國科學院計算機網絡信息中心，未經中國科學院計算機網絡信息中心許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/202110077894.4/1.html，轉載請聲明來源鉆瓜專利網。

上一篇：一種變壓器輸出電壓調節穩定裝置
下一篇：氣管插管通氣時的氣道管理方法及氣道管理系統和呼吸機

同類專利

專利分類

G06 計算；推算；計數
G06F 電數字數據處理

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產權局專利說明書；

2、支持發明專利、實用新型專利、外觀設計專利（升級中）；

3、專利數據每周兩次同步更新，支持Adobe PDF格式；

4、內容包括專利技術的結構示意圖、流程工藝圖或技術構造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】

友情鏈接：交換友情鏈接需要網站權重大于4，網站收錄10W以上，如符合條件，請聯系QQ：。

關于我們尋求報道投稿須知廣告合作版權聲明網站地圖友情鏈接企業標識聯系我們

在線咨詢

周一至周五 9:00-18:00

版權所有http://www.szxzyx.cn/公布日期

咨詢在線客服

咨詢在線客服

tel code back_top

主站蜘蛛池模板：国产二区免费| 国产日产高清欧美一区二区三区| 亚洲欧洲另类精品久久综合| 欧美日韩三区| 午夜欧美影院| 香蕉视频在线观看一区二区| 欧美日韩三区二区| 性色av香蕉一区二区| 91精品婷婷国产综合久久竹菊| 欧美精品一区二区久久| 欧美日韩一区二区三区不卡| 亚洲国产欧美一区二区丝袜黑人| 欧美亚洲视频二区| 欧美日韩一级二级| 最新国产精品久久精品| 午夜影院激情| 狠狠色噜噜狠狠狠四色米奇| 欧美日韩中文不卡| 高清国产一区二区三区| 又黄又爽又刺激久久久久亚洲精品 | 九色国产精品入口| 久久精品欧美一区二区| 欧美激情视频一区二区三区免费| xxxxhdvideosex| 91精品视频在线观看免费| 夜夜躁人人爽天天天天大学生| 亚洲精品主播| 欧美日韩国产免费观看| 蜜臀久久99精品久久久久久网站| 91午夜在线| 精品91av| 91精品www| 日本一区二区三区在线视频| 国产精品天堂网| 视频一区二区国产| 久久国产视屏| 狠狠色噜噜狠狠狠色综合| 日韩精品中文字幕一区二区三区 | 午夜av免费观看| 日韩中文字幕亚洲精品欧美| 国产91视频一区| 欧美二区精品| 国产一区二区三区久久久| 欧美精品一区二区久久久| 日韩精品中文字幕一区二区三区 | 国产免费区| 国产一区二区三区在线电影| 国产欧美精品一区二区三区小说| 91社区国产高清| 一区二区三区国产精华| 日韩欧美一区二区在线视频| 男女无遮挡xx00动态图120秒| 亚洲国产一区二区久久久777| 热99re久久免费视精品频软件| 国产免费一区二区三区四区| 国产日韩欧美色图| 久久99精品一区二区三区| 日本二区在线观看| 国产一区www| 国产1区2区3区中文字幕| 国产欧美精品va在线观看| 久久久午夜爽爽一区二区三区三州| av午夜影院| 欧美三级午夜理伦三级中视频| 国产馆一区二区| 性欧美激情日韩精品七区| 欧美亚洲视频二区| 欧美激情精品一区| 国产一区二区精品在线| 亚洲国产一区二区精华液| 国产精品一区二区久久乐夜夜嗨| 欧洲精品一区二区三区久久| 色一情一交一乱一区二区三区| 日韩av中文字幕一区二区| 国偷自产一区二区三区在线观看 | 国产九九九精品视频| 精品久久久久久中文字幕大豆网| 午夜影院一区| 最新国产一区二区| 美女张开腿黄网站免费| 精品国产一区二区在线| 亚洲精品国产setv|

<pre id="k0mqa"><menu id="k0mqa"></menu></pre>

<small id="k0mqa"><dd id="k0mqa"></dd></small>