版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、得益于計算機硬件的發(fā)展,現(xiàn)在大規(guī)模計算和并行計算得到了空前的關注。其相關配套的性能分析和評測技術也提上議程??茖W計算并行程序(下簡稱科學程序)的分析顯然和以前的單進程程序有所區(qū)別??茖W程序通常有計算密集、高度并行、很少依賴第三方庫等特點??茖W程序的并行通常是SPMD(Single Program Multiple Data)類型,常用MPI協(xié)議實現(xiàn)。
性能模型用于描述程序的特征。最直接的即是預測程序的執(zhí)行時間,常為一組公式。而
2、這里用一個起名為DwarfCode(下簡稱 DC)的程序作為性能模型來預測程序執(zhí)行時間。DC是在原程序的基礎上結合LLVM和編譯技術來生成的。在IR階段通過分析程序里的循環(huán)次數(shù)結合 LLVM的靜態(tài)分支概率,生成計算每個基本塊次數(shù)的指令并進行插樁;然后使用視點提升算法來調整插樁位置,同時尋找通信語句并生成計算通信量的指令來插樁。之后分析數(shù)據(jù)依賴進行刪減,從而使得執(zhí)行 DC花費的時間比原程序少,體現(xiàn)預測性。由于從原程序中刪減得來,DC的輸入
3、和原來一致。運行DC生成包含預測的基本塊次數(shù)的profiling文件,再結合機器特征能計算出預測的原程序執(zhí)行時間。以及更為細致的預測的每個基本塊執(zhí)行次數(shù)和每個函數(shù)的時間,總共通信所花費的時間等等。
本文最大的貢獻是提出了視點的概念,將靜態(tài)分析方法和動態(tài)EdgeProfiling方法兩個極端有機地統(tǒng)一起來。提出靜態(tài)性等于預測性,動態(tài)性等于準確性的觀點。本文最大的創(chuàng)新之處在于拋棄編譯優(yōu)化等價變換的固有觀念,采用破壞性的刪減的方法,
4、在盡量不改變程序特征的前提下拋棄程序的輸出結果,刪減計算部分代碼,運行DC的時間更少。提出預測代價和預測性價比的概念,指出在性價比大于1的時候,才有實施預測的意義。
本文指出性能模型由程序特征和機器特征所決定,將兩者分離從而使得DC的輸出滿足遷移性,和目標平臺無關。DC執(zhí)行簡單,使用方便。無需任何相關領域知識,無需任何參數(shù)設定,無需任何配置文件,無需了解代碼結構。無需預先做任何訓練。不僅磁盤空間開銷小,而且時間開銷和內存開銷相
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于聚類分析的搜索引擎自動性能評價研究.pdf
- 犯罪中止的自動性研究.pdf
- 中止犯自動性研究.pdf
- 數(shù)學公式圖像識別的自動性能評估.pdf
- 犯罪中止自動性的認定.pdf
- 犯罪中止的自動性淺析
- 典型WEB服務的自動性能測試工具的設計與實現(xiàn).pdf
- 論犯罪中止的自動性認定.pdf
- 語言教學自動性
- 基于工作記憶內容的視覺注意捕獲及其自動性研究.pdf
- 基于LLVM的函數(shù)內聯(lián)優(yōu)化技術研究.pdf
- 基于LLVM的迭代間數(shù)據(jù)重用優(yōu)化研究.pdf
- 基于LLVM的異構編譯優(yōu)化方法研究.pdf
- 28743.犯罪中止自動性判斷標準研究
- 基于LLVM的C-Core后端移植研究.pdf
- 小議犯罪中止“自動性”證明責任的分配
- 高性能計算系統(tǒng)內存子系統(tǒng)的性能預測模型研究.pdf
- 基于LLVM編譯架構的CSKY后端移植.pdf
- 內隱學習策略的探查及其自動性特征的實驗研究.pdf
- 基于預測的自動入侵響應模型的研究.pdf
評論
0/150
提交評論