版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、<p> 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院</p><p><b> 課程設(shè)計(jì)報(bào)告</b></p><p> 2011 — 2012學(xué)年第 1 學(xué)期</p><p> 課程名稱 微機(jī)原理與接口技術(shù) </p><p> 設(shè)計(jì)題目 計(jì)算機(jī)并行處理機(jī)制的研究 </p><p&
2、gt; 學(xué)生姓名 </p><p> 學(xué) 號(hào) </p><p> 專業(yè)班級(jí) </p><p> 指導(dǎo)教師 </p><p><b> 目錄</b><
3、/p><p><b> 一、概述1</b></p><p><b> 二、并行的概念1</b></p><p> 2. 1 并行性1</p><p> 2. 2 并行等級(jí)的劃分1</p><p> 2. 3 實(shí)現(xiàn)并行處理的技術(shù)途徑3</p>&l
4、t;p> 三、計(jì)算機(jī)內(nèi)部并行處理機(jī)制3</p><p><b> 3.1流水線3</b></p><p> 3.2超標(biāo)量結(jié)構(gòu)4</p><p> 3.3 超流水線結(jié)構(gòu)6</p><p> 3.4 VLIW(超長(zhǎng)指令字)6</p><p> 四、計(jì)算機(jī)間的并行處理機(jī)制8
5、</p><p> 4. 1對(duì)稱多處理機(jī)SMP8</p><p> 4. 1. 1 SMP的結(jié)構(gòu)和特性8</p><p> 4. 1. 2 多處理機(jī)中的擴(kuò)展存儲(chǔ)層次結(jié)構(gòu)9</p><p> 4. 2大規(guī)模并行處理機(jī)MPP10</p><p> 4. 2. 1 MPP的結(jié)構(gòu)和特性10</p&
6、gt;<p> 4. 2. 2 當(dāng)代MPP系統(tǒng)的公共體系結(jié)構(gòu)11</p><p><b> 4. 3機(jī)群12</b></p><p> 4 . 3. 1機(jī)群的概念和特性12</p><p> 4. 3. 2 機(jī)群的分類13</p><p> 4. 3. 3 機(jī)群的體系結(jié)構(gòu)13</p
7、><p> 五、總結(jié)與展望16</p><p><b> 六、參考資料16</b></p><p><b> 一、概述</b></p><p> 計(jì)算機(jī)從1946年的ENIAC機(jī)問(wèn)世以來(lái),至今已經(jīng)歷了五次更新?lián)Q代。每一代計(jì)算機(jī)的性能都成數(shù)量級(jí)倍的提高,計(jì)算機(jī)的體積、重量、價(jià)格、穩(wěn)定性、可靠性
8、、可維護(hù)性及功能的多樣性等均有了顯著的改善。人們通常以電子管、晶體管、中小規(guī)模集成電路、大規(guī)模和超大規(guī)模集成電路等器件的變革作為計(jì)算機(jī)換代的標(biāo)志。但是,計(jì)算機(jī)系統(tǒng)實(shí)際上是器件、硬件、軟件、算法、語(yǔ)言、系統(tǒng)結(jié)構(gòu)以及通訊技術(shù)等的綜合,所以計(jì)算機(jī)的換代也反映在上述各方面的巨大變革上。</p><p> 促使計(jì)算機(jī)迅速發(fā)展和系統(tǒng)性能極大提高的因素是多方面的,其中,器件技術(shù)尤其是微電子技術(shù)的迅速發(fā)展無(wú)疑是最為關(guān)鍵的因素,
9、它是計(jì)算機(jī)得以迅速發(fā)展的物質(zhì)基礎(chǔ)。然而,應(yīng)當(dāng)看到,如果不能最合理地利用這些新器件、新設(shè)備,最大限度地發(fā)揮出它們的內(nèi)在潛力,設(shè)計(jì)和構(gòu)成綜合性能指標(biāo)最佳的計(jì)算機(jī)系統(tǒng),只靠器件技術(shù)的變革是不行的,還需要硬件、軟件、算法、語(yǔ)言、系統(tǒng)結(jié)構(gòu)、通訊技術(shù)等多方面的發(fā)展變革才行。</p><p> 在特定的時(shí)期里,器件的發(fā)展變化會(huì)因物理、工藝、價(jià)格等條件限制而有一定限度。在同一種器件技術(shù)水平上,進(jìn)一步提高計(jì)算機(jī)系統(tǒng)性能的有效途徑
10、就是在系統(tǒng)結(jié)構(gòu)上使用并行處理技術(shù),挖掘出系統(tǒng)固有的并行性潛力,提高其并行性操作的程度。</p><p> 并行性在不同的處理級(jí)別中可表現(xiàn)為多種形式,如先行方式、流水方式、向量化、并發(fā)行、同時(shí)性、數(shù)據(jù)并行性、劃分、交叉、重疊、多重性、重復(fù)、時(shí)間共享、空間共享、多任務(wù)處理、多道程序、多線程方式和分布式計(jì)算等。</p><p><b> 二、并行的概念</b></
11、p><p><b> 2. 1 并行性</b></p><p> 只要在同一時(shí)刻或是同一時(shí)間間隔內(nèi)完成兩種或兩種以上性質(zhì)相同或不同的工作,它們?cè)跁r(shí)間上相互重疊,都體現(xiàn)了并行性。也就是說(shuō),并行性包括同時(shí)性和并發(fā)性兩重含義。同時(shí)性(simultaneity)指的是兩個(gè)或多個(gè)時(shí)間在同一時(shí)刻發(fā)生,并發(fā)性(concurrency)指的是兩個(gè)或多個(gè)事件在同一時(shí)間間隔內(nèi)發(fā)生。<
12、;/p><p> 2. 2 并行等級(jí)的劃分</p><p> 并行性可以劃分為不同的等級(jí),從不同的角度出發(fā),等級(jí)的劃分方法也不一樣。</p><p> 從計(jì)算機(jī)系統(tǒng)內(nèi)部執(zhí)行程序的角度來(lái)劃分</p><p> 指令內(nèi)部——一條指令內(nèi)部各種微操作之間的并行</p><p> 指令之間——多條指令在某一時(shí)刻或同一時(shí)間間
13、隔內(nèi)并行執(zhí)行</p><p> 任務(wù)或進(jìn)程之間——多個(gè)任務(wù)或程序段之間的并行執(zhí)行</p><p> 作業(yè)或程序之間——多個(gè)作業(yè)或多道程序之間的并行執(zhí)行</p><p> 從計(jì)算機(jī)系統(tǒng)中處理數(shù)據(jù)的并行性角度來(lái)看</p><p> 字串位串——同時(shí)只對(duì)一個(gè)字的一位進(jìn)行處理,通常指?jìng)鹘y(tǒng)的串行單處理機(jī),沒(méi)有并行性</p><
14、;p> 字串位并——同時(shí)對(duì)一個(gè)字的全部位進(jìn)行并行處理,通常指?jìng)鹘y(tǒng)的并行單處理機(jī),開(kāi)始出現(xiàn)并行性</p><p> 字并位串——同時(shí)對(duì)許多字的同一位進(jìn)行處理,開(kāi)始進(jìn)入并行處理領(lǐng)域</p><p> 字并位并——同時(shí)對(duì)許多字的全部或部分位組進(jìn)行處理。</p><p> 從計(jì)算機(jī)信息加工的各個(gè)步驟和階段來(lái)看</p><p> 存儲(chǔ)器
15、操作并行——可以采用單體多字、多體單字或多體多字方式在一個(gè)存儲(chǔ)周期內(nèi)訪問(wèn)多個(gè)字,進(jìn)而采用按內(nèi)容訪問(wèn)方式在一個(gè)存儲(chǔ)周期內(nèi)用位串字并獲全并行方式實(shí)現(xiàn)對(duì)存儲(chǔ)器中大量字的高速并行比較、檢索、更新、變換等操作。典型的例子就是并行存儲(chǔ)器系統(tǒng)和以相聯(lián)存儲(chǔ)器為核心構(gòu)成的相聯(lián)處理機(jī)。</p><p> 處理機(jī)操作步驟并行——處理機(jī)操作步驟可以指一條指令的取指、分析、執(zhí)行等操作步驟,也可指如浮點(diǎn)加法的求階差、對(duì)階、尾加、舍入、規(guī)格
16、化等具體操作的執(zhí)行步驟。操作步驟并行就是將操作步驟或具體操作的執(zhí)行步驟在時(shí)間上重疊流水地進(jìn)行。典型的例子就是流水線處理機(jī)。</p><p> 處理機(jī)操作并行——為支持向量、數(shù)組運(yùn)算,可以通過(guò)重復(fù)設(shè)置大量處理單元,讓它們?cè)谕豢刂破骺刂葡掳凑胀粭l指令的要求對(duì)多個(gè)數(shù)據(jù)組同時(shí)操作。典型的例子就是并行處理機(jī)。</p><p> 指令、任務(wù)、作業(yè)并行——這是較高級(jí)的并行,雖然它也可包含如操作、
17、操作步驟等較低等級(jí)的并行,但原則上與操作級(jí)并行是不同的。指令級(jí)以上的并行是多個(gè)處理機(jī)同時(shí)對(duì)多條指令及有關(guān)的多數(shù)據(jù)組進(jìn)行處理,而操作級(jí)并行是對(duì)同一條指令及其有關(guān)的多數(shù)據(jù)組進(jìn)行處理。因此,前者構(gòu)成的是多指令流多數(shù)據(jù)流(MIMD)計(jì)算機(jī),后者構(gòu)成的則是單指令流多數(shù)據(jù)流(SIMD)計(jì)算機(jī)。典型的例子是多處理機(jī)。</p><p> 2. 3 實(shí)現(xiàn)并行處理的技術(shù)途徑</p><p> 實(shí)現(xiàn)并行處理
18、的技術(shù)途徑是各種各樣的,其中主要有時(shí)間重疊、資源重復(fù)和資源共享等方法。</p><p> 時(shí)間重疊在并行性概念中引入時(shí)間因素,使多個(gè)處理過(guò)程在時(shí)間上錯(cuò)開(kāi),輪流重疊地使用同一套硬件設(shè)備的不同部件,以加快硬件周轉(zhuǎn)而贏得速度。最典型的例子就是流水線工作方式。時(shí)間重疊原則上不需要重復(fù)增加硬件設(shè)備就可提高系統(tǒng)的性能。</p><p> 資源重復(fù)在并行性概念中引入空間因素,通過(guò)重復(fù)設(shè)置硬件資源
19、,如處理機(jī)或外圍設(shè)備等,來(lái)達(dá)到大幅度提高可靠性和處理速度的目的。</p><p> 資源共享讓多個(gè)用戶按一定時(shí)間間隔輪流使用同一套資源,以提高系統(tǒng)的整體性能。</p><p> 三、計(jì)算機(jī)內(nèi)部并行處理機(jī)制</p><p> RISC處理機(jī)內(nèi)部可以采用如下技術(shù)來(lái)增加其并行性:</p><p> ?。?)哈佛結(jié)構(gòu):即設(shè)計(jì)分開(kāi)的指令cac
20、he和數(shù)據(jù)cache,可以并行工作。</p><p> ?。?)多端口的寄存器堆。如果一個(gè)寄存器堆有兩個(gè)源操作數(shù)端口和一個(gè)目的操作數(shù)端口,那么兩個(gè)源操作數(shù)可以同時(shí)取出,還可以寫(xiě)入或取出另一條指令的目的操作數(shù)。</p><p><b> (3)流水線。</b></p><p> ?。?)編譯優(yōu)化技術(shù)。充分利用硬件資源、優(yōu)化分配寄存器。&l
21、t;/p><p> ?。?)超標(biāo)量(super scalar)結(jié)構(gòu)。即設(shè)置多個(gè)執(zhí)行部件。</p><p> (6)超流水線(superpipeline)結(jié)構(gòu)。</p><p> ?。?)VLIW(Very Long Instruction Word)</p><p> 指令級(jí)并行處理(ILPP,Instruction Level Par
22、allel Processing)是實(shí)行低層機(jī)器操作的并行執(zhí)行,如存、取、整數(shù)加和浮點(diǎn)乘等。</p><p> 其中的流水線、超長(zhǎng)指令字VLIW、超標(biāo)量結(jié)構(gòu)等技術(shù)都屬于處理機(jī)指令級(jí)并行技術(shù),下面將分別對(duì)其加以介紹。</p><p><b> 3.1流水線</b></p><p> 一條典型指令的執(zhí)行基本上由取指、譯碼、執(zhí)行和寫(xiě)回4個(gè)階段組
23、成。由于不同階段的執(zhí)行由不同的功能部件來(lái)進(jìn)行,因此可以使得指令的執(zhí)行在時(shí)間上重迭起來(lái)。流水線的基本思想就是重迭連續(xù)指令的執(zhí)行以節(jié)省執(zhí)行時(shí)間和增加吞吐率。</p><p> 一般流水線結(jié)構(gòu)如下圖所示:</p><p> IPC(Instruction Per Cycle)=1,但由于數(shù)據(jù)相關(guān)、轉(zhuǎn)移相關(guān)和資源相關(guān)使得IPC<1。</p><p><b&g
24、t; 3.2超標(biāo)量結(jié)構(gòu)</b></p><p><b> 主要特點(diǎn):</b></p><p> ?。?)配置多個(gè)處理部件,采用多條流水線并行處理;</p><p> (2)能同時(shí)對(duì)若干條指令進(jìn)行譯碼,將可并行執(zhí)行的指令送往不同的執(zhí)行部件,從而達(dá)到每個(gè)周期啟動(dòng)多條指令的目的。</p><p> ?。?)在
25、程序運(yùn)行期間由硬件完成指令調(diào)度。</p><p> 下圖中,一個(gè)周期內(nèi)同時(shí)發(fā)出三條指令,有多個(gè)執(zhí)行部件,三條指令發(fā)到三個(gè)獨(dú)立的執(zhí)行部件去分別執(zhí)行。</p><p><b> 超標(biāo)量的典型結(jié)構(gòu):</b></p><p><b> 指令的執(zhí)行部件:</b></p><p> 存儲(chǔ)器操作部件:執(zhí)行
26、Load、Store指令</p><p><b> ALU:整數(shù)運(yùn)算</b></p><p> 轉(zhuǎn)移控制部件:執(zhí)行轉(zhuǎn)移指令</p><p> 狀態(tài)記錄部件(調(diào)度部件):</p><p> 進(jìn)行流水動(dòng)態(tài)調(diào)度。依靠硬件在程序運(yùn)行過(guò)程中對(duì)可能出現(xiàn)的相關(guān)情況加以檢測(cè),從而保證流水線中的各個(gè)功能部件能最大限度的重疊工作。&
27、lt;/p><p> 它對(duì)流水線中的各個(gè)功能部件的工作狀態(tài)、進(jìn)入流水線中的各條指令的工作狀態(tài)、它們所使用的源寄存器和目的寄存器情況等進(jìn)行集中的統(tǒng)一記錄和調(diào)度。</p><p> 在譯碼階段,狀態(tài)記錄部件根據(jù)所記錄的狀態(tài)決定是否將譯碼后的指令發(fā)送給有關(guān)功能部件進(jìn)行處理。</p><p> 狀態(tài)記錄部件主要檢查:</p><p> 該指令要使
28、用的功能部件是否已被流水線中的其它指令占用(資源沖突);</p><p> 該指令的源操作數(shù)寄存器是否為其它指令的目的寄存器,或者它所要寫(xiě)入的目的寄存器又正好是前面其它指令所要讀出的操作數(shù),或是要寫(xiě)入的目的寄存器。即檢查是否存在RAW、WAR、WAW的數(shù)據(jù)相關(guān)。</p><p> 3.3 超流水線結(jié)構(gòu)</p><p> 下圖中,一個(gè)流水段(一個(gè)周期)分成三個(gè)子
29、段,每個(gè)子段取出的仍只有一條指令,但總體來(lái)看,一個(gè)周期內(nèi)取出了三條指令,執(zhí)行部件可以一套,每個(gè)部件在一個(gè)子段時(shí)間內(nèi)完成。</p><p> 超標(biāo)量結(jié)構(gòu)、超流水線結(jié)構(gòu)一般采用指令窗方法,把一段指令取到窗口中,判斷這段指令能否并行執(zhí)行。</p><p> 超標(biāo)量和超流水線的比較</p><p> 超標(biāo)量:工作部件多,晶體管數(shù)目也多,每個(gè)部件的工作速度相對(duì)的可以低
30、一些。以空間換取時(shí)間。</p><p> 超流水線:工作部件少,晶體管數(shù)目少了,每一個(gè)部件必須在一個(gè)子周期內(nèi)執(zhí)行,工作速度較高。以時(shí)間換取了空間。</p><p> 3.4 VLIW(超長(zhǎng)指令字)</p><p> 1983年,Yale大學(xué)Fisher教授首先提出。</p><p> 一條長(zhǎng)指令來(lái)實(shí)現(xiàn)多個(gè)操作的并行執(zhí)行,以減少對(duì)存儲(chǔ)器
31、的訪問(wèn),這種長(zhǎng)指令往往達(dá)上百位,甚至上千位。</p><p> 如下面的圖。每拍啟動(dòng)一條長(zhǎng)指令,執(zhí)行3個(gè)操作,相當(dāng)于3條指令,要求并行度為3。</p><p><b> 主要特點(diǎn):</b></p><p> 單一的控制流。只有一個(gè)控制器,每個(gè)周期啟動(dòng)一條長(zhǎng)指令。</p><p> 超長(zhǎng)指令字被分成多個(gè)控制字段,每
32、個(gè)字段直接獨(dú)立的控制每個(gè)功能部件。</p><p> 含有大量的數(shù)據(jù)通路和功能部件,由于編譯器在編譯時(shí)間已經(jīng)考慮可能出現(xiàn)的數(shù)據(jù)相關(guān)和資源相關(guān),故控制硬件比較簡(jiǎn)單。</p><p> 在編譯階段完成超長(zhǎng)指令中多個(gè)可并行執(zhí)行操作的調(diào)度(超長(zhǎng)指令字的生成是由編譯器完成)。</p><p> VLIW機(jī)的結(jié)構(gòu)框圖</p><p> 四、計(jì)算機(jī)
33、間的并行處理機(jī)制</p><p> 體系結(jié)構(gòu)的并行性才是并行計(jì)算機(jī)真正的特點(diǎn),下面主要介紹當(dāng)代流行的幾種主要的并行體系結(jié)構(gòu):對(duì)稱多處理機(jī)SMP,大規(guī)模并行處理機(jī)MPP,機(jī)群。</p><p> 4. 1對(duì)稱多處理機(jī)SMP</p><p> 4. 1. 1 SMP的結(jié)構(gòu)和特性</p><p> SMP機(jī)器結(jié)構(gòu)圖如下: </p&g
34、t;<p> SMP結(jié)構(gòu)具有以下特性:</p><p> 對(duì)稱性 系統(tǒng)中任何處理機(jī)都可以對(duì)稱地訪問(wèn)任何存儲(chǔ)單元和I/O設(shè)備,且具有相同的訪存時(shí)間,所以也常叫均勻存儲(chǔ)訪問(wèn)UMA結(jié)構(gòu)</p><p> 單一物理地址空間所有處理器的存儲(chǔ)單元按照單一地址空間編址</p><p> 高速緩存及其一致性多極高速緩存可支持?jǐn)?shù)據(jù)局部性,且其一致性由硬件來(lái)
35、實(shí)現(xiàn)</p><p> 低通信延遲處理機(jī)間的通信用簡(jiǎn)單的讀/寫(xiě)指令來(lái)完成</p><p> 正是這些特性使得對(duì)稱處理機(jī)得到了廣泛使用。例如,由于存在單一物理地址空間,只需要一個(gè)OS副本駐留在共享存儲(chǔ)器中,OS可以按工作負(fù)載情況在多個(gè)處理機(jī)上調(diào)度進(jìn)程,從而易于達(dá)到動(dòng)態(tài)負(fù)載平衡和有效地利用系統(tǒng)資源。這一點(diǎn)使得它非常適合作為對(duì)吞吐率要求很高的服務(wù)器。</p><p>
36、; 從分層角度來(lái)看,SMP機(jī)器的硬件直接支持共享地址空間變成模型。由于存在類似于串行編程的單地址空間,任何處理機(jī)都可以用普通的讀/寫(xiě)指令來(lái)高效地存取共享數(shù)據(jù),并且共享數(shù)據(jù)在本地高速緩存間進(jìn)行自動(dòng)復(fù)制和移動(dòng),使得SMP對(duì)并行編程具有很大吸引力。從可移植性的角度出發(fā),在大部分SMP機(jī)器上也實(shí)現(xiàn)了消息傳遞編程模型。這通常是通過(guò)一些運(yùn)行庫(kù)的支持,在這些運(yùn)行庫(kù)中將共享地址空間的一部分指派給每個(gè)進(jìn)程,同時(shí)顯式地給每個(gè)進(jìn)程制定消息緩沖區(qū),通過(guò)在緩沖
37、區(qū)間拷貝數(shù)據(jù)來(lái)實(shí)現(xiàn)Send/Recv對(duì)。由于它們不需要操作系統(tǒng)的干預(yù),通常能獲得比傳統(tǒng)的分布式消息傳遞系統(tǒng)更好的消息傳遞性能,當(dāng)然前提是共享總線不能成為通信瓶頸。</p><p> 4. 1. 2 多處理機(jī)中的擴(kuò)展存儲(chǔ)層次結(jié)構(gòu) </p><p> 在SMP中所有的通信和本地計(jì)算都將導(dǎo)致對(duì)存儲(chǔ)器的讀/寫(xiě),因此從系統(tǒng)設(shè)計(jì)的角度出發(fā),擴(kuò)展存儲(chǔ)器的組織就是一個(gè)關(guān)鍵的設(shè)計(jì)因素。通常,隨著規(guī)模的增
38、大,多處理機(jī)中的存儲(chǔ)結(jié)構(gòu)分別屬于如圖所示的四種擴(kuò)展存儲(chǔ)層次結(jié)構(gòu),其中前三種是對(duì)稱多處理機(jī),而第四種不是。</p><p> 在共享高速緩存的結(jié)構(gòu)中,互連網(wǎng)絡(luò)位于處理器和共享的一級(jí)高速緩存之間。為了提高帶寬,高速緩存和主存系統(tǒng)都是可以交叉存取的。在20世紀(jì)80年代中期,這種結(jié)構(gòu)常被用來(lái)連接一個(gè)主板上的多個(gè)處理器,現(xiàn)在這種結(jié)構(gòu)可被用來(lái)實(shí)現(xiàn)單片多處理機(jī)(Multiprocessor-on-a-chip)。然而,這種結(jié)
39、構(gòu)中當(dāng)多個(gè)對(duì)稱處理器同時(shí)存取共享高速緩存時(shí),對(duì)高速緩存的帶寬要求很高;另外,對(duì)高速緩存數(shù)據(jù)的存取必須通過(guò)處理器和高速緩存間的互連網(wǎng)絡(luò),從而使得高速緩存存取延遲變大。所以,這種方法的可擴(kuò)展性很差,只適用于機(jī)器規(guī)模很小的情況,通常只支持2-8個(gè)處理器。</p><p> 在基于總線的共享內(nèi)存結(jié)構(gòu)中,互連網(wǎng)絡(luò)是處理器的私有高速緩存和共享內(nèi)存系統(tǒng)間的共享總線。這種結(jié)構(gòu)被廣泛地應(yīng)用于小規(guī)模和中等規(guī)模的多處理機(jī)中,其處理器
40、數(shù)目通常能達(dá)到20-30個(gè)。受共享總線和內(nèi)存系統(tǒng)的帶寬限制,基于總線的共享內(nèi)存方法的可擴(kuò)展性也不是很好。</p><p> 舞廳(Dancehall)結(jié)構(gòu)把互連網(wǎng)絡(luò)放在高速緩存和主存之間,但是互連網(wǎng)絡(luò)是一個(gè)可擴(kuò)展的點(diǎn)到點(diǎn)網(wǎng)絡(luò),同時(shí)內(nèi)存被劃分為許多邏輯模塊,連到互連網(wǎng)絡(luò)的不同連接點(diǎn)。這種結(jié)構(gòu)是對(duì)稱的,所有的處理器到內(nèi)存的距離是相同的,缺點(diǎn)是所有內(nèi)存存取都要經(jīng)過(guò)互連網(wǎng)絡(luò),當(dāng)其規(guī)模較大時(shí),內(nèi)存存取延遲較大。</
41、p><p> 分布式內(nèi)存的結(jié)構(gòu)不是對(duì)稱的,處理節(jié)點(diǎn)之間銅鼓哦一個(gè)可擴(kuò)展的互連網(wǎng)絡(luò)相連,每個(gè)節(jié)點(diǎn)有本地內(nèi)存,對(duì)本地內(nèi)存的存取比對(duì)遠(yuǎn)地內(nèi)存的存取快得多。通過(guò)利用數(shù)據(jù)分布的局部性原理,大多數(shù)的高速緩存的缺失的存取幾乎都能在本地內(nèi)存中得到滿足。這種結(jié)構(gòu)對(duì)于設(shè)計(jì)可擴(kuò)展的多處理器最具有吸引力。</p><p> 4. 2大規(guī)模并行處理機(jī)MPP</p><p> 4. 2. 1
42、 MPP的結(jié)構(gòu)和特性</p><p> MPP并行機(jī)體系結(jié)構(gòu)模型如下圖示:</p><p> MPP通常具有如下特點(diǎn):</p><p> 在處理節(jié)點(diǎn)中使用通用微處理器,且每個(gè)節(jié)點(diǎn)有一個(gè)或多個(gè)微處理器</p><p> 在處理節(jié)點(diǎn)內(nèi)使用物理上分布的存儲(chǔ)器</p><p> 使用具有高通信帶寬和低延遲的互連網(wǎng)絡(luò)
43、,節(jié)點(diǎn)間彼此緊密耦合</p><p> 能擴(kuò)展成具有成百上千個(gè)處理器</p><p> 是一個(gè)異步多指令流多數(shù)據(jù)流MIMD機(jī),進(jìn)程同步采用鎖方式消息傳遞操作,而不是用共享變量同步操作加以實(shí)現(xiàn)</p><p> 程序由多個(gè)進(jìn)程組成,每個(gè)進(jìn)程有自己的私有地址空間,通過(guò)顯示的消息傳遞實(shí)現(xiàn)進(jìn)程間互相通信,數(shù)據(jù)分布對(duì)于用戶不是透明的。</p><p&
44、gt; MPP的主要應(yīng)用是科學(xué)計(jì)算、工程模擬和信號(hào)處理等以計(jì)算為主的領(lǐng)域。目前的MPP系統(tǒng)主要有兩種獲取大規(guī)模并行的不同途徑,包括以Cray T3E系統(tǒng)為代表的無(wú)硬件支持的高速緩存一致性的分布式存儲(chǔ)器NCC-NUMA體系結(jié)構(gòu),和以Intel/Sandia ASCI Option Red系統(tǒng)為代表的非遠(yuǎn)程存儲(chǔ)訪問(wèn)的NORMA體系結(jié)構(gòu)。</p><p> 4. 2. 2 當(dāng)代MPP系統(tǒng)的公共體系結(jié)構(gòu)</p&
45、gt;<p> 當(dāng)代MPP系統(tǒng)的公共體系結(jié)構(gòu)如圖所示。</p><p> 所有MPP都使用物理上分布的主存,并且越來(lái)越多的MPP使用了分布式I/O。每個(gè)節(jié)點(diǎn)有一個(gè)或多個(gè)處理器和高速緩存(P/C)、一個(gè)局部存儲(chǔ)器、有或沒(méi)有磁盤(pán)。節(jié)點(diǎn)內(nèi)有一個(gè)本地互連網(wǎng)絡(luò),連接處理器、主存和I/O設(shè)備。</p><p> MPP采用如下技術(shù)來(lái)提高可擴(kuò)展性:</p><p&
46、gt; 使用物理上分布式主存的體系結(jié)構(gòu),它比集中式主存體系結(jié)構(gòu)提供了更高的總主存帶寬,因此有潛在的更高可擴(kuò)展性;</p><p> 平衡的處理能力和主存與I/O能力,若沒(méi)有成比例的高速主存和I/O子系統(tǒng),那么數(shù)據(jù)不能以足夠的速度送入處理器,高速處理器就幾乎毫無(wú)價(jià)值;</p><p> 平衡的計(jì)算能力和并行性與交互能力,如無(wú)此特征,則進(jìn)程/線程管理及通信和同步的開(kāi)銷將是執(zhí)行時(shí)間的主要部
47、分。</p><p> MPP與機(jī)群的關(guān)鍵差別在于節(jié)點(diǎn)間的通信。在機(jī)群中,節(jié)點(diǎn)通常通過(guò)標(biāo)準(zhǔn)局域網(wǎng)相連,而在MPP中,節(jié)點(diǎn)希由高帶寬及低時(shí)延的高速專有網(wǎng)絡(luò)互連,同時(shí)還提供專有通信軟件,以實(shí)現(xiàn)高性能。所有這些使得現(xiàn)有MPP在通信性能上超過(guò)機(jī)群,然而,由于標(biāo)準(zhǔn)網(wǎng)絡(luò)技術(shù)的飛速發(fā)展,目前無(wú)法確定應(yīng)用于MPP的連接技術(shù),在未來(lái)多長(zhǎng)時(shí)間內(nèi)還將繼續(xù)領(lǐng)先于應(yīng)用于機(jī)群的網(wǎng)絡(luò)技術(shù)。</p><p> MPP
48、面臨的主要問(wèn)題:</p><p> 實(shí)際的性能差:MPP實(shí)際的可用性能通常遠(yuǎn)低于其峰值性能;</p><p> 可編程性差:并行程序的開(kāi)發(fā)比較困難,串行程序向并行程序的自動(dòng)轉(zhuǎn)換效果不好,且不同平臺(tái)間并行程序的有效移植也有一定的難度。</p><p><b> 4. 3機(jī)群</b></p><p> 4 . 3.
49、1機(jī)群的概念和特性</p><p> 機(jī)群是一組獨(dú)立的計(jì)算機(jī)(節(jié)點(diǎn))的集合體,節(jié)點(diǎn)間通過(guò)高性能的互連網(wǎng)絡(luò)連接;各節(jié)點(diǎn)除了可以作為一個(gè)單一的計(jì)算資源供交互式用戶使用外,還可以協(xié)同工作,并表現(xiàn)為一個(gè)單一的、集中的計(jì)算資源,供并行計(jì)算任務(wù)使用。機(jī)群是一種造價(jià)低廉、易于構(gòu)筑、并且具有較好可擴(kuò)展性的體系結(jié)構(gòu)。</p><p> 機(jī)群具有如下重要特征:</p><p>
50、機(jī)群的各節(jié)點(diǎn)都是一個(gè)完整的系統(tǒng),節(jié)點(diǎn)可以是工作站,也可以是PC機(jī)或SMP機(jī)器;</p><p> 互連網(wǎng)絡(luò)通常使用標(biāo)準(zhǔn)局域網(wǎng)絡(luò),如以太網(wǎng)、FDDI、光纖通道等,部分商用機(jī)群也采用專用網(wǎng)絡(luò)相連;</p><p> 網(wǎng)絡(luò)接口與節(jié)點(diǎn)的I/O總線松耦合相連;</p><p><b> 各節(jié)點(diǎn)有本地磁盤(pán);</b></p><p&
51、gt; 各節(jié)點(diǎn)有自己完整的操作系統(tǒng)。</p><p> MPP通常是一種無(wú)共享(Shared-Nothing)的體系結(jié)構(gòu),節(jié)點(diǎn)可以有多種硬件構(gòu)成方式,不過(guò)大多數(shù)只有主存和處理器。SMP可以認(rèn)為是一種完全共享(Shared-Everything)的體系結(jié)構(gòu),所有的處理器共享所有可用的全局資源(總線、內(nèi)存和I/O等)。對(duì)于機(jī)群來(lái)說(shuō),機(jī)群的節(jié)點(diǎn)復(fù)雜度通常比MPP高,因?yàn)楦鳈C(jī)群節(jié)點(diǎn)都有自己的本地磁盤(pán)和完整的操作系統(tǒng);
52、MPP的節(jié)點(diǎn)通常沒(méi)有磁盤(pán),并且可能只是使用一個(gè)微內(nèi)核,而不是一個(gè)完整的操作系統(tǒng);SMP服務(wù)器則比一個(gè)機(jī)群節(jié)點(diǎn)要復(fù)雜,因?yàn)樗懈嗟耐庠O(shè)終端,如終端、打印機(jī)和外部RAID等。</p><p> 4. 3. 2 機(jī)群的分類</p><p> 根據(jù)不同的分類標(biāo)準(zhǔn),有不同的分類方法。</p><p> 根據(jù)應(yīng)用目標(biāo),可分為高性能機(jī)群(High Performance
53、Cluster, HP Cluster)和高可用性機(jī)群(High Available Cluster, HA Cluster)</p><p> 根據(jù)節(jié)點(diǎn)擁有情況,可以分為專用機(jī)群(Dedicated Cluster)和非專用機(jī)群(Nondedicated Cluster)。專用機(jī)群中所有的資源是共享的,并行應(yīng)用可以在整個(gè)機(jī)群上運(yùn)行;而在非專用機(jī)群中,全局應(yīng)用通過(guò)竊取CPU時(shí)間來(lái)獲得運(yùn)行,非專用機(jī)群中由于存在本
54、地用戶和遠(yuǎn)地用戶對(duì)處理器的競(jìng)爭(zhēng),帶來(lái)了進(jìn)程遷移和負(fù)載平衡等問(wèn)題</p><p> 根據(jù)節(jié)點(diǎn)的硬件構(gòu)成,可以分為PC機(jī)群(Cluster of PCs, CoPC)、工作站機(jī)群(Cluster of workstation, COW)和對(duì)稱多處理機(jī)SMP機(jī)群(Cluster of SMPs, CLUMPs)</p><p> 根據(jù)節(jié)點(diǎn)的操作系統(tǒng),可以分為L(zhǎng)inux機(jī)群(如Beowulf)
55、、Solaris機(jī)群(如Berkeley NOW)、NT機(jī)群(如HPVM)、AIX機(jī)群(如IBM SP2)</p><p> 根據(jù)節(jié)點(diǎn)的配置,可以分為同構(gòu)機(jī)群和異構(gòu)機(jī)群。同構(gòu)機(jī)群中各節(jié)點(diǎn)有相似的體系,并且使用相同的操作系統(tǒng),而異構(gòu)機(jī)群中節(jié)點(diǎn)可以有不同的體系,運(yùn)行的操作系統(tǒng)也可以不盡相同。</p><p> 4. 3. 3 機(jī)群的體系結(jié)構(gòu)</p><p><
56、b> 機(jī)群節(jié)點(diǎn)連接方式</b></p><p> 機(jī)群節(jié)點(diǎn)有三種連接方式,如下圖所示。 </p><p> 無(wú)共享機(jī)群,節(jié)點(diǎn)間通過(guò)I/O總線連接;共享磁盤(pán)的體系常用于注重可用性的商用小規(guī)模及其上,在節(jié)點(diǎn)失效時(shí)能由其他節(jié)點(diǎn)承擔(dān)失效節(jié)點(diǎn)的工作;共享存儲(chǔ)器的集群節(jié)點(diǎn)間通過(guò)存儲(chǔ)總線連接,由于比前兩種機(jī)群難于實(shí)現(xiàn),還沒(méi)有得到廣泛的應(yīng)用。</p><p>
57、; 機(jī)群的理想體系結(jié)構(gòu)如下圖所示:</p><p><b> 五、總結(jié)與展望</b></p><p> 在上一個(gè)學(xué)期的《微機(jī)原理與接口技術(shù)》的課程中,我們對(duì)微機(jī)的一些主要的原理技術(shù)進(jìn)行了學(xué)習(xí)。在學(xué)習(xí)的過(guò)程中上我們對(duì)微型計(jì)算機(jī)的各種體系結(jié)構(gòu)和各種技術(shù)有了更深入的認(rèn)識(shí)和了解。這對(duì)我們今后進(jìn)一步的學(xué)習(xí)打下了堅(jiān)實(shí)的理論技術(shù)。而通過(guò)本課程的上機(jī)實(shí)驗(yàn),又使我們對(duì)本課程中的一
58、些技術(shù)在應(yīng)用層面的認(rèn)識(shí)得到加深。</p><p> 本文作為《微機(jī)原理與接口技術(shù)》的課程設(shè)計(jì)論文,主要從計(jì)算機(jī)內(nèi)部的并行處理機(jī)制以及計(jì)算機(jī)間的并行處理機(jī)制給予探討。通過(guò)在編寫(xiě)本論文中,不斷的搜集有關(guān)并行技術(shù)的資料以及對(duì)這些資料進(jìn)行歸類總結(jié),是我對(duì)并行技術(shù)有了更進(jìn)一步的認(rèn)識(shí)以及領(lǐng)悟。這對(duì)我今后的工作有很大的幫助。</p><p> 現(xiàn)今比較流行的物聯(lián)網(wǎng)技術(shù)中,少不了對(duì)并行技術(shù)的應(yīng)用。在整
59、個(gè)物聯(lián)網(wǎng)的系統(tǒng)中,各個(gè)應(yīng)用的實(shí)現(xiàn)大多數(shù)是要實(shí)現(xiàn)實(shí)時(shí)響應(yīng)的,這些應(yīng)用中可能會(huì)同時(shí)要求系統(tǒng)對(duì)請(qǐng)求給予響應(yīng)。在此處,我們就可以看到了并行處理在此處應(yīng)用的好處,它可以使系統(tǒng)能夠同時(shí)對(duì)進(jìn)程進(jìn)行響應(yīng)。</p><p> 最后,感謝xx老師的課程講授以及輔導(dǎo)!</p><p><b> 六、參考資料</b></p><p> 陳國(guó)良等著,《并行計(jì)算機(jī)體
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 微機(jī)原理與接口技術(shù)課程設(shè)計(jì)
- 微機(jī)原理與接口技術(shù)課程設(shè)計(jì)
- 微機(jī)原理與接口技術(shù)課程設(shè)計(jì).
- 微機(jī)原理與接口技術(shù)課程設(shè)計(jì)
- 微機(jī)原理與接口技術(shù)課程設(shè)計(jì)報(bào)告
- 計(jì)算機(jī)控制與接口技術(shù)課程設(shè)計(jì)
- 微機(jī)接口技術(shù)課程設(shè)計(jì)
- 微機(jī)接口技術(shù)課程設(shè)計(jì)
- 微機(jī)原理與接口技術(shù)課程設(shè)計(jì)--流水燈
- 微機(jī)原理與接口技術(shù)課程設(shè)計(jì)---模擬計(jì)算器設(shè)計(jì)
- 微機(jī)原理與接口技術(shù)課程設(shè)計(jì)-交通燈
- 紅外通信-微機(jī)原理與接口技術(shù)課程設(shè)計(jì)報(bào)告
- 微機(jī)原理與接口技術(shù)課程設(shè)計(jì) --存儲(chǔ)器
- 微機(jī)原理與接口技術(shù)課程設(shè)計(jì)報(bào)告書(shū)
- 《微機(jī)原理與接口技術(shù)》課程設(shè)計(jì)
- 微機(jī)接口技術(shù)課程設(shè)計(jì)報(bào)告
- 微機(jī)原理與接口技術(shù)課程設(shè)計(jì)-----交通燈設(shè)計(jì)
- 微型計(jì)算機(jī)原理與接口技術(shù)課程設(shè)計(jì)--兵乓球比賽
- 電子表設(shè)計(jì)(微機(jī)原理與接口技術(shù)課程設(shè)計(jì))
- 單片微型計(jì)算機(jī)原理與接口技術(shù)課程設(shè)計(jì)報(bào)告——溫度測(cè)量
評(píng)論
0/150
提交評(píng)論