![](https://static.zsdocx.com/FlexPaper/FileRoot/2019-3/14/17/5da2e2ba-968b-4609-88a0-02b48e5f2615/5da2e2ba-968b-4609-88a0-02b48e5f2615pic.jpg)
![大規(guī)模CFD高效CPU-GPU異構(gòu)并行計算關(guān)鍵技術(shù)研究.pdf_第1頁](https://static.zsdocx.com/FlexPaper/FileRoot/2019-3/14/17/5da2e2ba-968b-4609-88a0-02b48e5f2615/5da2e2ba-968b-4609-88a0-02b48e5f26151.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、計算流體力學(xué)(Computational Fluid Dynamics,CFD)采用數(shù)值計算方法求解流動控制方程以發(fā)現(xiàn)各種流動現(xiàn)象和規(guī)律,已廣泛應(yīng)用于航空航天等領(lǐng)域。隨著數(shù)值模擬的幾何外形、物理模型日益復(fù)雜,流動機理研究越來越精細(xì),CFD計算的規(guī)模和復(fù)雜度空前增長,迫切需要利用高性能計算機實現(xiàn)高效CFD并行計算以提升CFD應(yīng)用效率。
近年來,隨著圖像處理器(Graphics Processing Unit,GPU)浮點運算性能
2、和可編程性的提升,采用CPU/GPU異構(gòu)體系結(jié)構(gòu)成為構(gòu)造高性能計算機系統(tǒng)的一種趨勢。盡管異構(gòu)體系結(jié)構(gòu)能夠在兼顧通用性和效能的同時大幅提升系統(tǒng)性能,但復(fù)雜的硬件架構(gòu)要求研究者綜合利用多種編程模型以挖掘多層次并行性,對高效CFD并行應(yīng)用開發(fā)帶來了極大的挑戰(zhàn)。
本文面向CPU/GPU異構(gòu)體系結(jié)構(gòu)和典型CFD應(yīng)用,圍繞大規(guī)模、高效CFD異構(gòu)協(xié)同并行計算關(guān)鍵技術(shù)開展研究,重點研究了CFD應(yīng)用異構(gòu)協(xié)同并行編程框架、并行算法和性能優(yōu)化、負(fù)載
3、均衡等問題。論文的工作包括:
(1)針對多區(qū)塊結(jié)構(gòu)網(wǎng)格CFD計算的特點,提出了適應(yīng)大型CPU/GPU異構(gòu)系統(tǒng)的TLCF三層異構(gòu)協(xié)同編程框架。綜合MPI、OpenMP和CUDA編程模型,給出了TLCF框架的三種實例:嵌套OpenMP的TLCF框架(NOMP-TLCF)、OpenMP異步執(zhí)行的TLCF框架(OMPAE-TLCF)以及MPI異步執(zhí)行的TLCF框架(MPIAE-TLCF)。通過分析這三種編程框架的優(yōu)缺點,發(fā)現(xiàn)NOMP-
4、TLCF編程框架更適用于大規(guī)模異構(gòu)并行系統(tǒng)上CFD應(yīng)用的開發(fā)。
?。?)針對計算流體力學(xué)中格子Boltzmann方程的求解,研究其在CPU/GPU異構(gòu)并行系統(tǒng)上的并行算法。首先,針對算法中的碰撞、遷移及邊界處理過程,構(gòu)建了基于網(wǎng)格單元映射的單GPU并行方法;在傳統(tǒng)的依賴共享存儲(AS)算法基礎(chǔ)上,提出直接存儲(AD)算法以適應(yīng)單GPU訪存方式的發(fā)展。然后,根據(jù)CPU和GPU的協(xié)同方式及通信與計算重疊的程度,分別提出了基本并行LB
5、M-base算法、通信與計算重疊并行LBM-overlap算法、CPU/GPU協(xié)同計算并行LBM-hybrid算法。算法性能的理論分析和測試結(jié)果表明,相對AS算法,AD算法能采用更多線程配置,獲得更好性能。相對于兩個6核CPU,格子Boltzmann方法在單GPU上可獲得17倍的性能加速比。多計算節(jié)點的并行性能測試結(jié)果顯示,相對于單個計算節(jié)點,性能最好的LBM-hybrid并行算法在128個計算節(jié)點上能獲得82.0%并行效率。
6、?。?)針對計算流體力學(xué)中的Navier-Stokes方程的求解,研究其在CPU/GPU異構(gòu)并行系統(tǒng)上的并行算法。首先,提出了基于網(wǎng)格單元的細(xì)粒度單GPU并行算法;為消除無粘項求解過程中的數(shù)據(jù)依賴,提出了冗余計算方法和內(nèi)核函數(shù)分解方法。然后,基于NOMP-TLCF編程框架提出了基于網(wǎng)格區(qū)塊的粗粒度并行算法,并通過流與異步執(zhí)行的方式重疊數(shù)據(jù)傳輸與GPU計算過程,減少CPU與GPU之間數(shù)據(jù)傳輸?shù)拈_銷。針對計算節(jié)點內(nèi)不同處理部件的計算能力和存
7、儲能力的差異,提出了Out-of-Core方法以增加單個節(jié)點上的模擬規(guī)模。進(jìn)一步的,我們提出了TCBO和TCBL兩種傳輸策略,降低計算節(jié)點間的數(shù)據(jù)通信開銷。數(shù)值實驗驗證了異構(gòu)并行算法的正確性,相對于單核CPU,GPU的性能加速比在8倍左右;相對于兩個6核CPU,單GPU能獲得約1.85倍的性價比優(yōu)勢;強擴展性和弱擴展性測試結(jié)果都表明該并行算法有較好的加速比和并行效率。
(4)從粗粒度和細(xì)粒度兩個方面,研究了CPU/GPU異構(gòu)并
8、行系統(tǒng)的負(fù)載均衡策略。在粗粒度負(fù)載均衡方面,對于多區(qū)塊結(jié)構(gòu)網(wǎng)格Navier-Stokes方程的求解,考慮了不同處理單元的計算性能差異以及通信對應(yīng)用性能影響,提出了基于性能模型的靜態(tài)負(fù)載均衡策略。然后,為消除性能模型中的若干假設(shè),提出了基于預(yù)取的任務(wù)竊取動態(tài)調(diào)度算法。實驗測試表明,兩種負(fù)載均衡算法都能較好的均衡處理單元之間的負(fù)載。在細(xì)粒度負(fù)載均衡方面,針對稀疏矩陣向量乘的求解,研究其在采用不同稀疏矩陣存儲格式時GPU的性能,指出當(dāng)矩陣各行
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 面向CPU-GPU異構(gòu)并行計算的代碼生成關(guān)鍵技術(shù)研究.pdf
- CPU-GPU異構(gòu)并行計算體系的設(shè)計與實現(xiàn).pdf
- 基于 CPU-GPU 異構(gòu)并行計算的刀具路徑規(guī)劃方法研究.pdf
- 基于CPU-GPU異構(gòu)并行系統(tǒng)的大規(guī)模人工社會仿真計算加速方法研究.pdf
- 基于CPU-GPU異構(gòu)并行計算的OTN仿真驗證系統(tǒng)的研究與實現(xiàn).pdf
- 14505.面向大規(guī)模并行計算的lbmfvm耦合模擬關(guān)鍵技術(shù)研究
- 面向應(yīng)用的GPU并行計算關(guān)鍵技術(shù)研究.pdf
- 基于CPU-GPU集群的分子動力學(xué)并行計算研究.pdf
- 面向應(yīng)用的加速器增強型異構(gòu)系統(tǒng)大規(guī)模并行計算關(guān)鍵技術(shù)研究.pdf
- 基于CPU+GPU的圖像處理異構(gòu)并行計算研究.pdf
- 基于CPU-GPU異構(gòu)并行系統(tǒng)的Smith Waterman及HEVC加速技術(shù)研究.pdf
- 多核異構(gòu)環(huán)境下通用并行計算框架關(guān)鍵技術(shù)研究.pdf
- CPU-GPU協(xié)同的道路監(jiān)控關(guān)鍵技術(shù)研究與開發(fā).pdf
- 基于GPU的大規(guī)模顆粒并行計算與優(yōu)化.pdf
- 虛擬現(xiàn)實仿真平臺異構(gòu)并行計算關(guān)鍵技術(shù)研究.pdf
- 面向千萬億次CPU-GPU異構(gòu)系統(tǒng)的編程模型與性能優(yōu)化關(guān)鍵技術(shù)研究.pdf
- 基于CPU-GPU協(xié)作環(huán)境的快速大規(guī)模SVM訓(xùn)練.pdf
- 面向超級計算的大規(guī)模并行存儲系統(tǒng)關(guān)鍵技術(shù)研究.pdf
- 大規(guī)模電網(wǎng)潮流計算關(guān)鍵技術(shù)研究.pdf
- 基于GPU異構(gòu)體系結(jié)構(gòu)的大規(guī)模圖數(shù)據(jù)挖掘關(guān)鍵技術(shù)研究.pdf
評論
0/150
提交評論