版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、GPGPU的主要目標(biāo)是利用GPU強(qiáng)大的并行計(jì)算能力進(jìn)行通用目的的計(jì)算。為了支持通用計(jì)算,GPU的結(jié)構(gòu)也開(kāi)始針對(duì)通用計(jì)算優(yōu)化,但GPU固有的SIMD工作方式依然是限制其性能發(fā)揮的巨大障礙。其主要的問(wèn)題是SIMD及其類似結(jié)構(gòu)所面臨的控制分離和存儲(chǔ)分離問(wèn)題。而目前在控制分離上的研究往往沒(méi)有考慮其對(duì)存儲(chǔ)系統(tǒng)造成的影響,從而可能導(dǎo)致其性能不穩(wěn)定,甚至出現(xiàn)性能下降。
本文總結(jié)了GPGPU線程調(diào)度的研究現(xiàn)狀,指出了其中存在的問(wèn)題。其中,
2、PDOM機(jī)制不能調(diào)度其所有分支路徑;DWS的分支機(jī)制雖然能調(diào)度所有的分支路徑卻存在則由于缺少子恢復(fù)點(diǎn)信息而面臨warp過(guò)度細(xì)分的問(wèn)題。針對(duì)PDOM機(jī)制和DWS機(jī)制的優(yōu)缺點(diǎn),本文提出了一種子恢復(fù)點(diǎn)感知的混合棧式機(jī)制,該棧式機(jī)制通過(guò)增加葉子節(jié)點(diǎn)表和附加的數(shù)據(jù)通道。該混合棧式機(jī)制能對(duì)任意路徑的節(jié)點(diǎn)進(jìn)行正常的PDOM機(jī)制的恢復(fù)操作,且具備DWS機(jī)制的所有分支路徑的調(diào)度能力,在這基礎(chǔ)上還能防止DWS過(guò)度細(xì)分,具備了更強(qiáng)的調(diào)度靈活性。
3、 為了充分發(fā)揮本文混合棧式機(jī)制的延遲覆蓋潛力,本文通過(guò)分析發(fā)現(xiàn),如果能讓一部分warp先于其他warp先行執(zhí)行,就能讓后續(xù)的warp利用其計(jì)算周期覆蓋前面先跑warp的計(jì)算周期,強(qiáng)化GPGPU的延遲覆蓋能力。由此出發(fā)本文提出了一種基于窗口的調(diào)度機(jī)制,該機(jī)制通過(guò)引入調(diào)度窗口和等待隊(duì)列,讓調(diào)度窗口中的warp先于等待隊(duì)列中的warp先運(yùn)行,并在調(diào)度窗口內(nèi)的warp遇到長(zhǎng)周期存儲(chǔ)訪問(wèn)時(shí)切換warp,并通過(guò)先行發(fā)射混合棧式機(jī)制中存在存儲(chǔ)指令的分
4、支來(lái)進(jìn)一步強(qiáng)化存儲(chǔ)延遲覆蓋能力。本文對(duì)調(diào)度器窗口的大小、子warp調(diào)度優(yōu)先級(jí)以及存儲(chǔ)節(jié)流等調(diào)度策略和實(shí)現(xiàn)細(xì)節(jié)進(jìn)行了討論。
本文通過(guò)GPGPU-SIM模擬器對(duì)該棧式機(jī)制及基于窗口的調(diào)度算法進(jìn)行了驗(yàn)證。通過(guò)對(duì)12種組合進(jìn)行性能對(duì)比測(cè)試和敏感性測(cè)試,其結(jié)果表明,最佳的性能是在本文提出的兩種機(jī)制的組合下取得的,其相對(duì)于基準(zhǔn)測(cè)試平臺(tái)平均性能提高10.5%,相對(duì)于DWS平均性能提高6.8%,相對(duì)于PDOM和基于窗口調(diào)度機(jī)制的最佳性能提
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于棧的GPGPU調(diào)度器設(shè)計(jì)研究.pdf
- 基于運(yùn)行特性的GPGPU節(jié)能研究.pdf
- 基于GPGPU的軟陰影算法研究.pdf
- 基于GPGPU的SILK語(yǔ)音Codec優(yōu)化.pdf
- 基于GPGPU加速的鐵軌扣件識(shí)別研究.pdf
- 基于GPGPU的快速體繪制算法研究.pdf
- 基于網(wǎng)絡(luò)處理器的雙棧路由器的設(shè)計(jì)與實(shí)現(xiàn).pdf
- 基于嵌入式Linux路由器網(wǎng)絡(luò)協(xié)議棧的研究與設(shè)計(jì).pdf
- 基于μC-OS-Ⅱ的調(diào)度算法改進(jìn)及LwIP協(xié)議棧移植.pdf
- 基于混合集群節(jié)能調(diào)度器的研究與設(shè)計(jì).pdf
- 基于ZigBee的無(wú)線傳感器網(wǎng)絡(luò)協(xié)議棧的設(shè)計(jì)與實(shí)現(xiàn).pdf
- 眾核結(jié)構(gòu)的基于塊的硬件調(diào)度器設(shè)計(jì)研究.pdf
- 基于GPGPU-Sim模擬的GPU功耗研究.pdf
- 基于GPGPU視頻編解碼技術(shù)研究.pdf
- 基于構(gòu)件思想的ZigBee協(xié)議棧研究與設(shè)計(jì).pdf
- 基于GPGPU的復(fù)雜網(wǎng)絡(luò)分析算法的設(shè)計(jì)與實(shí)現(xiàn).pdf
- 棧的課程設(shè)計(jì)--- 棧的類設(shè)計(jì)
- 基于msstatePAN協(xié)議棧的監(jiān)控系統(tǒng)的研究與設(shè)計(jì).pdf
- 基于GPGPU的快速白光干涉測(cè)量系統(tǒng)研究.pdf
- 基于GT的動(dòng)態(tài)網(wǎng)格資源調(diào)度器的研究與設(shè)計(jì).pdf
評(píng)論
0/150
提交評(píng)論