版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、隨著嵌入式應(yīng)用的飛速發(fā)展以及芯片設(shè)計(jì)技術(shù)的不斷進(jìn)步,處理器結(jié)構(gòu)專(zhuān)注于采用更多的并行計(jì)算資源開(kāi)發(fā)并行性,而不再依賴(lài)于更復(fù)雜的串行硬件設(shè)計(jì)和更高的時(shí)鐘頻率。以超長(zhǎng)指令字技術(shù)為主體,融合變長(zhǎng)指令集、單指令流多數(shù)據(jù)流(SIMD)以及多核等技術(shù)的數(shù)字信號(hào)處理器(DSP)體系結(jié)構(gòu),已經(jīng)成為DSP體系結(jié)構(gòu)技術(shù)發(fā)展的主流。盡管這些體系結(jié)構(gòu)技術(shù)能以較低的硬件開(kāi)銷(xiāo),充分開(kāi)發(fā)應(yīng)用程序并行性,從而大幅提高處理器性能,但隨著指令發(fā)射復(fù)雜度和SIMD寬度的增加,這
2、些技術(shù)越來(lái)越受到數(shù)據(jù)通路利用率和可擴(kuò)展性問(wèn)題的困擾。本文研究面向性能的SIMD DSP指令流調(diào)度技術(shù),主要從指令流分布、指令流取指發(fā)射和指令流執(zhí)行三個(gè)部分展開(kāi)。首先,分析和研究SIMD寬度、VLIW長(zhǎng)度和多核數(shù)目在內(nèi)的體系結(jié)構(gòu)參數(shù)之間的關(guān)聯(lián),考察負(fù)載工作量的特征值,包括線(xiàn)程級(jí)并行(TLP),指令級(jí)并行(ILP),以及數(shù)據(jù)級(jí)并行(DLP)發(fā)生變化時(shí),資源分配對(duì)系統(tǒng)效能造成的影響,以解釋結(jié)構(gòu)中的性能瓶頸,實(shí)現(xiàn)數(shù)據(jù)通路利用率和可擴(kuò)展性的高效權(quán)
3、衡;其次,變長(zhǎng)VLIW處理器的取指發(fā)射流水效率,能夠顯著影響整個(gè)數(shù)據(jù)通路的利用率,研究取指和發(fā)射的關(guān)鍵問(wèn)題,以減少取指和發(fā)射導(dǎo)致的流水線(xiàn)停頓,能夠顯著提升DSP性能。再次,對(duì)于廣泛應(yīng)用于高性能DSP中的SIMD技術(shù)而言,增大SIMD寬度并不一定能夠提高程序執(zhí)行性能,不同算法對(duì)SIMD寬度和程序流控制的需求有著顯著不同,提高 SIMD資源利用率對(duì)于提高系統(tǒng)性能有顯著影響。
本研究主要內(nèi)容包括:⑴借鑒近年來(lái)在通用多核芯片上的對(duì)性能
4、和功耗的相關(guān)分析與研究,構(gòu)建了一個(gè)新型的參數(shù)化性能功耗綜合分析模型,來(lái)評(píng)估層次化片上大規(guī)模并行結(jié)構(gòu)的性能和功耗。該模型抽象出參數(shù)諸如多核數(shù)量、超節(jié)點(diǎn)尺寸、處理單元數(shù)目、功能單元數(shù)目等,在滿(mǎn)足一定性能約束和功耗約束的前提下,考察負(fù)載工作量的特征值TLP、ILP和DLP發(fā)生變化時(shí),資源分配對(duì)系統(tǒng)效能造成的影響。解析結(jié)果提供了對(duì)于設(shè)計(jì)超高性能DSP結(jié)構(gòu)的合理的選擇,以及使得系統(tǒng)具有更好可擴(kuò)展性的理論基礎(chǔ),進(jìn)一步揭示結(jié)構(gòu)中的性能瓶頸。⑵為提高變
5、長(zhǎng)VLIW處理器的取指發(fā)射流水效率,減少和消除現(xiàn)有單線(xiàn)程取指發(fā)射流水線(xiàn)效率提升機(jī)制的弊端,提出了一種基于變長(zhǎng)指令 VLIW結(jié)構(gòu)的高效取指發(fā)射流水架構(gòu)。該架構(gòu)引入了無(wú)效指令的檢測(cè)作廢機(jī)制,來(lái)消除無(wú)效的取指訪(fǎng)問(wèn)帶來(lái)的開(kāi)銷(xiāo);引入了缺失指令旁路機(jī)制,來(lái)減少缺失指令引發(fā)的流水線(xiàn)停頓;引入了變長(zhǎng)指令發(fā)射窗機(jī)制,解決分離指令字帶來(lái)的發(fā)射問(wèn)題,從而為結(jié)構(gòu)提供高效連續(xù)的指令流。這一研究進(jìn)一步揭示了基于VLIW架構(gòu)的取指發(fā)射流水線(xiàn)架構(gòu)的加速機(jī)理,使得單線(xiàn)程
6、流控加速技術(shù)變得清晰,這對(duì)指導(dǎo)高效流控機(jī)制設(shè)計(jì)具有重要意義。這種取指發(fā)射流水線(xiàn)能夠很好地在任意基于VLIW結(jié)構(gòu)的處理器中進(jìn)行應(yīng)用。⑶提出了向量分支線(xiàn)程壓縮機(jī)制(DBTC),來(lái)解決因應(yīng)用中沒(méi)有包含充足的DLP,如應(yīng)用中往往存在循環(huán)遍數(shù)低,控制流復(fù)雜,執(zhí)行行為不均勻的情況,而導(dǎo)致的SIMD資源空轉(zhuǎn)問(wèn)題。將 SIMD硬件并行資源轉(zhuǎn)換成實(shí)際的應(yīng)用性能,才是發(fā)揮 SIMD結(jié)構(gòu)處理器性能的關(guān)鍵所在。試驗(yàn)結(jié)果表明:向量分支線(xiàn)程壓縮機(jī)制相較于基準(zhǔn) SI
7、MD結(jié)構(gòu),能夠獲取很好的加速。⑷提出一種稱(chēng)為解耦的迭代映射(DIM)的方法,來(lái)解決因應(yīng)用中包含迭代間相關(guān)的循環(huán)而導(dǎo)致的SIMD低效問(wèn)題,開(kāi)發(fā)了潛伏在算法中的中粒度的流水線(xiàn)線(xiàn)程并行,獲取了類(lèi)似于多核線(xiàn)程級(jí)并行的執(zhí)行模式。它通過(guò)軟硬件的協(xié)同配合,動(dòng)態(tài)的映射包含迭代間相關(guān)的循環(huán)到改進(jìn)的SIMD結(jié)構(gòu)上,每一個(gè)處理單元(PE)能夠解耦的執(zhí)行循環(huán)體的一個(gè)片段的不同迭代,lane間的數(shù)據(jù)傳遞通過(guò)專(zhuān)用數(shù)據(jù)緩沖鏈(DBC)完成,從而自動(dòng)榨取之前無(wú)法在SI
8、MD結(jié)構(gòu)上并行執(zhí)行的線(xiàn)程。DIM維護(hù)線(xiàn)程的局部性,隱藏了關(guān)鍵路徑延遲。實(shí)驗(yàn)結(jié)果表明,DIM能夠保持SIMD結(jié)構(gòu)的關(guān)鍵優(yōu)勢(shì),并且大大提升SIMD結(jié)構(gòu)處理含有迭代間相關(guān)應(yīng)用的效率。⑸提出硬件支持軟流水機(jī)制(HSSP),來(lái)加速包含規(guī)整控制流的數(shù)據(jù)級(jí)并行循環(huán)體的執(zhí)行。繼而,提出多模式指令流出思想,它將解決非規(guī)整條件分支控制流的DBTC技術(shù),提升體間相關(guān)循環(huán)的DIM技術(shù),與優(yōu)化規(guī)整控制流的HSSP技術(shù)有機(jī)結(jié)合起來(lái),從而提升SIMD結(jié)構(gòu)的綜合實(shí)力,
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 面向VLIW處理器的指令調(diào)度技術(shù)研究.pdf
- 向量SIMD DSP上高效矩陣運(yùn)算技術(shù)研究.pdf
- 面向BWDSP的SIMD編譯優(yōu)化技術(shù)研究與實(shí)現(xiàn).pdf
- 面向SIMD的自動(dòng)并行化關(guān)鍵技術(shù)研究.pdf
- 面向性能優(yōu)化的虛擬機(jī)熱遷移技術(shù)研究.pdf
- 匯率決定的微觀(guān)市場(chǎng)結(jié)構(gòu)理論——基于指令流的分析.pdf
- 生產(chǎn)指令流轉(zhuǎn)管理規(guī)程
- SIMD編譯優(yōu)化技術(shù)研究.pdf
- 面向SDN的流量調(diào)度技術(shù)研究.pdf
- 外匯指令流,中央銀行干預(yù)與人民幣匯率的形成
- 高性能X-DSP指令流水線(xiàn)部件設(shè)計(jì)實(shí)現(xiàn)與軟硬件協(xié)同驗(yàn)證.pdf
- 面向非多媒體程序的SIMD向量化方法及優(yōu)化技術(shù)研究.pdf
- 面向多核的多層次實(shí)時(shí)網(wǎng)絡(luò)數(shù)據(jù)流調(diào)度技術(shù)研究.pdf
- 面向性能優(yōu)化的產(chǎn)品結(jié)構(gòu)定制關(guān)鍵技術(shù)研究及其應(yīng)用.pdf
- 面向ASIC處理器的指令多發(fā)射技術(shù)研究.pdf
- 面向MapReduce計(jì)算模型的調(diào)度技術(shù)研究.pdf
- 面向注塑企業(yè)的車(chē)間生產(chǎn)調(diào)度技術(shù)研究.pdf
- 數(shù)據(jù)偏斜條件下面向性能與能耗的任務(wù)調(diào)度算法研究.pdf
- 面向GIS的工作流技術(shù)研究.pdf
- 面向COTS DSP軟錯(cuò)誤的故障恢復(fù)技術(shù)研究.pdf
評(píng)論
0/150
提交評(píng)論