版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、近年來,隨著GPGPU在生物計(jì)算、金融分析、天氣預(yù)測(cè)等高性能計(jì)算領(lǐng)域發(fā)揮著越來越重要的作用,有關(guān)GPGPU的相關(guān)研究逐漸成為研究的熱點(diǎn)。在模擬器設(shè)計(jì)方面,一個(gè)高性能的模擬器對(duì)GPGPU的研究而言至關(guān)重要,而當(dāng)前GPGPU模擬器大多為串行模擬器,模擬速度極慢,極大制約了模擬器在GPGPU體系結(jié)構(gòu)研究中的應(yīng)用。在GPGPU體系結(jié)構(gòu)設(shè)計(jì)方面,隨著GPGPU計(jì)算能力的不斷增加,GPGPU中越來越多的計(jì)算節(jié)點(diǎn)需要通過片上網(wǎng)絡(luò)與存儲(chǔ)節(jié)點(diǎn)進(jìn)行通信。隨
2、著片上網(wǎng)絡(luò)在片上多核系統(tǒng)設(shè)計(jì)中所占的開銷不斷增大,如何在保持性能不變的前提下設(shè)計(jì)低開銷的片上網(wǎng)絡(luò)對(duì)于GPGPU的發(fā)展至關(guān)重要。
針對(duì)于第一個(gè)問題,本文提出了GPGPU并行模擬的方案,充分利用現(xiàn)有宿主平臺(tái)多機(jī)多核的計(jì)算優(yōu)勢(shì)加速GPGPU程序的模擬速度;針對(duì)第二個(gè)問題,本文提出了GPGPU低開銷片上網(wǎng)絡(luò)設(shè)計(jì)的方案,首先通過一系列的設(shè)計(jì)避免了網(wǎng)絡(luò)中報(bào)文的沖突,然后通過簡(jiǎn)化路由器微體系結(jié)構(gòu)設(shè)計(jì)降低了片上網(wǎng)絡(luò)的開銷。
本文的研
3、究工作和成果有:
?。?)提出了GPGPU在多核多機(jī)平臺(tái)下的并行模擬方案
在多核宿主平臺(tái)下,本文提出了Kernel內(nèi)部的并行模擬,一方面使用多個(gè)模擬線程同時(shí)對(duì)多個(gè)Cluster進(jìn)行模擬,并要求多個(gè)模擬線程在每個(gè)時(shí)鐘周期進(jìn)行同步以保持模擬精度,另一方面并行化執(zhí)行驅(qū)動(dòng)中的功能模擬和性能模擬以彌補(bǔ)時(shí)鐘同步帶來的性能損失。在多機(jī)宿主平臺(tái)下,本文提出了Kernel之間并行模擬的方案,將Kernel函數(shù)進(jìn)行分組后利用多機(jī)平臺(tái)并行的
4、對(duì)各組進(jìn)行模擬以獲得性能的提升。在GPGPU模擬器對(duì)程序進(jìn)行模擬的過程中,它會(huì)依賴功能模擬提供的結(jié)果,因此功能模擬在一定程度上會(huì)制約GPGPU模擬器的模擬速度,本文針對(duì)CUDA編程模型的特點(diǎn)提出了一種并行化功能模擬的方法,并就它應(yīng)用到了Kernel內(nèi)部、Kernel之間并行模擬中。
?。?)提出了GPGPU低開銷片上網(wǎng)絡(luò)設(shè)計(jì)方案
本文針對(duì)GPGPU中Request網(wǎng)絡(luò)的通信特點(diǎn)提出了低開銷的片上網(wǎng)絡(luò)設(shè)計(jì)。將計(jì)算節(jié)點(diǎn)分為
5、若干組,通過向各組分配專屬子網(wǎng)避免了不同組之間的報(bào)文沖突;設(shè)計(jì)了令牌發(fā)射機(jī)制以及令牌傳輸網(wǎng)絡(luò),徹底避免了組內(nèi)的報(bào)文沖突,并對(duì)網(wǎng)絡(luò)不存在任何沖突進(jìn)行了證明;設(shè)計(jì)了低開銷的路由器微體系結(jié)構(gòu),實(shí)現(xiàn)了報(bào)文在相鄰路由器之間的單周期傳輸;設(shè)計(jì)了狀態(tài)回傳網(wǎng)絡(luò),使計(jì)算節(jié)點(diǎn)可以感知存儲(chǔ)節(jié)點(diǎn)中報(bào)文緩存隊(duì)列的狀態(tài)變化,從而進(jìn)行相應(yīng)的發(fā)包調(diào)整。
本文對(duì)上述方案進(jìn)行實(shí)現(xiàn),并針對(duì)多個(gè)CUDA測(cè)試集中的測(cè)試程序?qū)ο到y(tǒng)性能進(jìn)行了詳細(xì)的測(cè)試與分析。實(shí)驗(yàn)結(jié)果表明
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 片上網(wǎng)絡(luò)低費(fèi)用測(cè)試方法研究.pdf
- 片上網(wǎng)絡(luò)低能耗和低延遲研究.pdf
- 低負(fù)載片上網(wǎng)絡(luò)通訊路徑約束方法研究.pdf
- 片上網(wǎng)絡(luò)性能評(píng)估平臺(tái)設(shè)計(jì).pdf
- 片上網(wǎng)絡(luò)低功耗設(shè)計(jì)研究.pdf
- 基于多fpga的片上網(wǎng)絡(luò)模擬平臺(tái)設(shè)計(jì)和實(shí)現(xiàn)
- 機(jī)會(huì)網(wǎng)絡(luò)低開銷路由算法研究.pdf
- 基于片上網(wǎng)絡(luò)的層級(jí)并行可進(jìn)化硬件系統(tǒng)研究.pdf
- 片上網(wǎng)絡(luò)的低功耗模擬及映射研究.pdf
- 低開銷的Ad Hoc網(wǎng)絡(luò)路由協(xié)議.pdf
- 片上網(wǎng)絡(luò)低功耗設(shè)計(jì)方法研究.pdf
- 片上網(wǎng)絡(luò)路由算法的優(yōu)化設(shè)計(jì).pdf
- 片上網(wǎng)絡(luò)優(yōu)化策略設(shè)計(jì)與仿真.pdf
- 片上網(wǎng)絡(luò)映射算法研究和設(shè)計(jì).pdf
- 實(shí)時(shí)約束下的低擁堵片上網(wǎng)絡(luò)映射技術(shù)研究.pdf
- 基于GPU平臺(tái)的片上網(wǎng)絡(luò)模擬器的研究與設(shè)計(jì).pdf
- 片上網(wǎng)絡(luò)模擬器在GPU平臺(tái)上的設(shè)計(jì)與優(yōu)化.pdf
- 片上網(wǎng)絡(luò)系統(tǒng)模型.pdf
- 片上網(wǎng)絡(luò)交換結(jié)構(gòu)研究.pdf
- 基于微片狀態(tài)模擬的片上網(wǎng)絡(luò)能耗計(jì)算.pdf
評(píng)論
0/150
提交評(píng)論