并行區(qū)域

上傳人：奔*** IP屬地：河北更新時(shí)間：2024-01-05 格式：ppt 頁(yè)數(shù)：85 大小：1.63MB 人氣指數(shù)：12 舉報(bào) 版權(quán)申訴

2023年全國(guó)碩士研究生考試考研英語(yǔ)一試題真題（含答案詳解+作文范文）_第1頁(yè)

已閱讀1頁(yè)，還剩84頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第四章 OpenMP多線程編程,主要內(nèi)容,OpenMP編程簡(jiǎn)介 OpenMP多線程應(yīng)用程序編程技術(shù),1. OpenMP編程簡(jiǎn)介,,1.1 OpenMP多線程編程發(fā)展概況,OpenMP是一種面向共享內(nèi)存多線程并行編程技術(shù)OpenMP具有良好的可移植性支持多種編程語(yǔ)言 Fortran C/C++支持多種平臺(tái) www.openmp.org,,OpenMP最初是為共享內(nèi)存的多處理器系統(tǒng)設(shè)計(jì)的并行編程方法，這與通過(guò)消息傳遞進(jìn)行并行編程

2、模型有很大的不同。,OpenMP的支持環(huán)境,Intel的C++和Fortran編譯器Microsoft的Visual Studio 2005gcc4.2以上版本,1.2 OpenMP多線程編程基礎(chǔ),OpenMP的編程模型以線程為基礎(chǔ)，通過(guò)編譯制導(dǎo)語(yǔ)句來(lái)顯示地指導(dǎo)并行化 OpenMP的執(zhí)行模型采用Fork-Join的形式，在開(kāi)始時(shí)，只有一個(gè)叫做主線程的運(yùn)行線程存在；在運(yùn)行過(guò)程中，當(dāng)遇到需要進(jìn)行并行計(jì)算的時(shí)候，派生出（Fork）線程來(lái)

3、執(zhí)行并行任務(wù)；在并行代碼結(jié)束執(zhí)行，派生線程退出或掛起，控制流程回到單獨(dú)的主線程中（Join）,Fork-Join模型,并行區(qū)域,OpenMP的實(shí)現(xiàn),編譯制導(dǎo)語(yǔ)句（精髓）運(yùn)行時(shí)庫(kù)函數(shù)環(huán)境變量,編譯制導(dǎo)語(yǔ)句,在編譯器編譯程序的時(shí)候，會(huì)識(shí)別特定的注釋，而這些注釋就包含著OpenMP程序的一些語(yǔ)義在一個(gè)無(wú)法識(shí)別OpenMP語(yǔ)意的普通編譯器中，這些注釋會(huì)被當(dāng)作普通的注釋而被忽略在C/C++程序中，OpenMP所有編譯制導(dǎo)語(yǔ)句以#pra

4、gma omp開(kāi)始，后面跟具體功能指令,編譯制導(dǎo)語(yǔ)句,,編譯制導(dǎo)語(yǔ)句,Directiveparallel, for, parallel for, section, sections, single, master, critical, flush, ordered, atomic,運(yùn)行時(shí)庫(kù)函數(shù),OpenMP運(yùn)行時(shí)函數(shù)庫(kù)主要用以設(shè)置和獲取執(zhí)行環(huán)境相關(guān)的信息，它們當(dāng)中也包含一系列用以同步的API 運(yùn)行時(shí)函數(shù)庫(kù) “omp.h”omp

5、_get_thread_num() 返回當(dāng)前線程的號(hào)碼,,通過(guò)編譯制導(dǎo)語(yǔ)句,可以將串行的程序逐步地改造成一個(gè)并行程序,達(dá)到增量更新程序的目的,減少程序編寫(xiě)人員一定的負(fù)擔(dān).串行程序和并行程序保持在同一個(gè)源代碼文件當(dāng)中,減少了維護(hù)負(fù)擔(dān).編譯制導(dǎo)語(yǔ)句,優(yōu)勢(shì)體現(xiàn)在編譯階段運(yùn)行時(shí)庫(kù)函數(shù),支持運(yùn)行時(shí)對(duì)并行環(huán)境的改變和優(yōu)化,1.3 編寫(xiě)OpenMP程序的準(zhǔn)備工作,當(dāng)前的Visual Studio .Net 2005完全支持OpenMP 2.0

6、標(biāo)準(zhǔn) 通過(guò)新的編譯器選項(xiàng) /openmp來(lái)支持OpenMP程序的編譯和鏈接,建立一個(gè)新的項(xiàng)目,配置項(xiàng)目屬性,設(shè)置環(huán)境變量,在OpenMP中，主要通過(guò)對(duì)循環(huán)或一段結(jié)構(gòu)化代碼定義并行區(qū)域的方式來(lái)實(shí)現(xiàn)多線程并行。,#include "omp.h"int _tmain(int argc, _TCHAR* argv[]){printf("Hello from serial.\n");prin

7、tf("Thread number=%d\n",omp_get_thread_num());#pragma omp parallel{printf("Hello from parallel. Thread number=%d\n", omp_get_thread_num());}printf("Hello from serial again.\n");

8、getchar();return 0;},2. OpenMP多線程應(yīng)用程序編程技術(shù),,2.1 循環(huán)并行化,循環(huán)并行化是使用OpenMP來(lái)并行化程序的最重要的部分在C/C++語(yǔ)言中，循環(huán)并行化語(yǔ)句的編譯制導(dǎo)語(yǔ)句格式如下： #pragma omp parallel for [clause[clause…]]for（ i = first ; i<last ; i++） {body of the loop;},另

9、一種格式： #pragma omp parallel [clause[clause…]]{#pragma omp for [clause[clause…]]for（ i = first ; i<last ; i++） {body of the loop;}}如果并行的線程需要在循環(huán)的開(kāi)始，或結(jié)束時(shí)作些工作的話，就只能用parallel與for子句分離的版本。Parallel 將緊跟的程序塊擴(kuò)展為若干完全等同

10、的并行區(qū)域，每個(gè)線程擁有完全相同的并行區(qū)域；For 將循環(huán)中工作分配到線程組中，線程組中的每一個(gè)線程完成循環(huán)中的一部分。子句用來(lái)控制編譯制導(dǎo)語(yǔ)句的具體行為。,循環(huán)并行化語(yǔ)句的限制,并行化的語(yǔ)句必須是for循環(huán)語(yǔ)句并具有規(guī)范格式能夠推測(cè)出循環(huán)的次數(shù) for （index = start ; index < end ; increment_expr）在循環(huán)過(guò)程中不能使用break語(yǔ)句不能使用goto和return語(yǔ)句從

11、循環(huán)中跳出可以使用continue語(yǔ)句,簡(jiǎn)單循環(huán)并行化,各個(gè)分量之間沒(méi)有數(shù)據(jù)相關(guān)性循環(huán)計(jì)算的過(guò)程也沒(méi)有循環(huán)依賴型,循環(huán)依賴性,循環(huán)迭代相關(guān),循環(huán)迭代相關(guān),,,循環(huán)分塊技術(shù)創(chuàng)建無(wú)循環(huán)迭代相關(guān)的循環(huán)m,,循環(huán)并行化編譯制導(dǎo)語(yǔ)句的子句,循環(huán)并行化子句可以包含一個(gè)或者多個(gè)子句來(lái)控制循環(huán)并行化的實(shí)際執(zhí)行常見(jiàn)子句有：作用域子句（變量是共享的share還是私有的private）控制線程的調(diào)度（schedule ）子句動(dòng)態(tài)控制是否并行化

12、（if ）子句進(jìn)行同步的子句（ordered ）子句控制變量在串行部分與并行部分傳遞（copyin ）子句,循環(huán)嵌套,可以將嵌套循環(huán)的任意一個(gè)循環(huán)體進(jìn)行并行化循環(huán)并行化編譯指導(dǎo)語(yǔ)句可以加在任意一個(gè)循環(huán)之前，則對(duì)應(yīng)的最近的循環(huán)語(yǔ)句被并行化，其它部分保持不變,,,,,控制數(shù)據(jù)的共享屬性,OpenMP程序在同一個(gè)共享內(nèi)存空間上執(zhí)行可以任意使用這個(gè)共享內(nèi)存空間上的變量進(jìn)行線程間的數(shù)據(jù)傳遞 OpenMP還允許線程保留自己的私有變量不

13、能讓其它線程訪問(wèn)到,,分配在棧上的數(shù)據(jù)都是私有的全局變量及代碼是共享的動(dòng)態(tài)分配的堆空間是共享的threadprivate指明某數(shù)據(jù)結(jié)構(gòu)是私有的全局變量,控制數(shù)據(jù)的共享屬性,shared用來(lái)指示一個(gè)變量的作用域是共享的。privare用來(lái)指示一個(gè)變量的作用域是私有的。firstprivate對(duì)私有變量進(jìn)行初始化，把串行變量值拷貝到私有變量中（線程開(kāi)始）lastprivate對(duì)私有變量最后終結(jié)的操作，把私有變量拷貝到同名串行變量

14、中,使用作用域子句的一些規(guī)則,作用域子句中的變量是已經(jīng)聲明的有名變量作用域子句在作用到類或者結(jié)構(gòu)的時(shí)候，只能作用到類或者結(jié)構(gòu)的整體，而不能只作用域類或者結(jié)構(gòu)的一個(gè)部分一個(gè)編譯指導(dǎo)語(yǔ)句能夠包含多個(gè)數(shù)據(jù)作用域子句作用域子句只能出現(xiàn)在編譯制導(dǎo)語(yǔ)句起作用的語(yǔ)句變量部分默認(rèn)情況下，并行區(qū)域中的所有變量是共享的，三種例外：parallel for 循環(huán)中，循環(huán)變量是私有的并行區(qū)域中的局部變量是私有的Private，firstpr

15、ivate，lastprivate，reduction子句列出的變量是私有的,,,規(guī)約操作的并行化,在規(guī)約操作中，會(huì)反復(fù)將一個(gè)二元運(yùn)算符應(yīng)用在一個(gè)變量和另外一個(gè)值上，并把結(jié)果保存在原變量中在使用規(guī)約操作時(shí)，只需在變量前指明規(guī)約操作的類型以及規(guī)約的變量 # pragma omp parallel for private（arx,ary,n） reduction（+:a,b）for（i=0;i<n;i++）{a=a+arx

16、[i];b=b+ary[i];},規(guī)約操作并行化的限制,能夠在OpenMP的C/C++語(yǔ)言中出現(xiàn)的規(guī)約操作,私有變量的初始化和終結(jié)操作,循環(huán)并行化開(kāi)始的時(shí)候，私有變量具有主線程中的同名變量的值循環(huán)并行化后將私有變量返回給主線程中的同名變量firstprivate lastprivate,,,數(shù)據(jù)相關(guān)性與并行化操作,并不是所有的循環(huán)都能夠使用#pragma omp parallel for來(lái)進(jìn)行并行化必須要保證數(shù)據(jù)兩次循

17、環(huán)之間不存在數(shù)據(jù)相關(guān)性數(shù)據(jù)相關(guān)性又被稱為數(shù)據(jù)競(jìng)爭(zhēng)（Data Race）當(dāng)兩個(gè)線程對(duì)同一個(gè)變量進(jìn)行操作，并且有一個(gè)操作為寫(xiě)操作的時(shí)候，就說(shuō)明這兩個(gè)線程存在數(shù)據(jù)競(jìng)爭(zhēng),,,2.2 并行區(qū)域編程,循環(huán)并行化實(shí)際上是并行區(qū)域編程的一個(gè)特例并行區(qū)域簡(jiǎn)單的說(shuō)就是通過(guò)編譯制導(dǎo)語(yǔ)句使得一段代碼能夠在多個(gè)線程內(nèi)部同時(shí)執(zhí)行并行區(qū)域編寫(xiě)的格式如下：#pragma omp parallel [clause[clause]…]block,

18、parallel編譯制導(dǎo)語(yǔ)句的執(zhí)行過(guò)程,當(dāng)程序遇到parallel編譯制導(dǎo)語(yǔ)句的時(shí)候，就會(huì)生成相應(yīng)數(shù)目（根據(jù)環(huán)境變量）的線程組成一個(gè)線程組，并將代碼重復(fù)地在各個(gè)線程內(nèi)部執(zhí)行 parallel的末尾有一個(gè)隱含的同步屏障（barrier），所有線程完成所需的重復(fù)任務(wù)有，在這個(gè)同步屏障出會(huì)和（join）,,,線程私有數(shù)據(jù)threadprivate,copyin,threadprivate指明(全局)變量是線程私有數(shù)據(jù)copyin對(duì)線程私有

19、的全局變量進(jìn)行初始化,線程私有數(shù)據(jù)與threadprivate, copyin子句,,,工作隊(duì)列,工作隊(duì)列的基本工作過(guò)程：為維持一個(gè)工作的隊(duì)列，線程在并行執(zhí)行的時(shí)候，不斷從這個(gè)隊(duì)列中取出相應(yīng)的工作完成，直到隊(duì)列為空為止,,,,,根據(jù)線程號(hào)分配任務(wù),每一個(gè)線程在執(zhí)行的過(guò)程中的線程標(biāo)識(shí)號(hào)是不同的，可以根據(jù)這個(gè)線程標(biāo)識(shí)號(hào)來(lái)分配不同的任務(wù) #pragma omp parallel private（myid）{nthreads=omp_g

20、et_num_threads（）;myid=omp_get_thread_num（）;get_my_work_done（myid,nthreads）;},使用循環(huán)語(yǔ)句分配任務(wù),,工作分區(qū)編碼,,2.3 線程同步,OpenMP支持兩種不同類型的線程同步機(jī)制：互斥鎖：可以用來(lái)保護(hù)一塊共享的存儲(chǔ)空間，使得每一次訪問(wèn)這塊共享內(nèi)存空間的線程最多一個(gè)，保證了數(shù)據(jù)的完整性事件通知：這種機(jī)制保證了多個(gè)線程之間的執(zhí)行順序,數(shù)據(jù)競(jìng)爭(zhēng),,互斥鎖機(jī)

21、制,用來(lái)對(duì)一塊內(nèi)存進(jìn)行保護(hù)OpenMP提供了三種不同的互斥鎖機(jī)制：臨界區(qū)（critical）原子操作（atomic）由庫(kù)函數(shù)來(lái)提供同步操作（互斥函數(shù)）,臨界區(qū)（critical）,臨界區(qū)通過(guò)編譯指導(dǎo)語(yǔ)句對(duì)產(chǎn)生數(shù)據(jù)競(jìng)爭(zhēng)的內(nèi)存變量進(jìn)行保護(hù) 在程序需要訪問(wèn)可能產(chǎn)生競(jìng)爭(zhēng)的內(nèi)存數(shù)據(jù)的時(shí)候，都需要插入相應(yīng)的臨界區(qū)代碼 #pragma omp critical [（name）]block在執(zhí)行上述的程序塊block之前，必須首先

22、要獲得臨界區(qū)的控制權(quán),正整數(shù)組最大的元素,,原子操作,現(xiàn)代體系結(jié)構(gòu)的多處理計(jì)算機(jī)提供了原子更新一個(gè)單一內(nèi)存單元的方法，提供了一種更高效率的互斥鎖機(jī)制。通過(guò)編譯制導(dǎo)可以調(diào)用上述方法#pragma omp atomicx ++,,,運(yùn)行時(shí)庫(kù)函數(shù)的互斥鎖支持,,,,,,事件同步機(jī)制,鎖：維護(hù)一塊代碼或者一塊內(nèi)存的一致性；事件：用來(lái)控制代碼的執(zhí)行順序，使得某一部分代碼必須在其它的代碼執(zhí)行完畢之后才能執(zhí)行。OpenMP中的事件同步主

23、要包括：同步屏障（barrier）定序區(qū)段（ordered sections）主線程執(zhí)行（master）,隱含的同步屏障（barrier）,在每一個(gè)并行區(qū)域都會(huì)有一個(gè)隱含的同步屏障一個(gè)同步屏障要求所有的線程執(zhí)行到此屏障，然后才能夠繼續(xù)執(zhí)行下面的代碼 #pragma omp for，#pragma omp single， #pragma omp sections程序塊都包含自己的隱含的同步屏障為了避免在循環(huán)過(guò)程中不必要的同步

24、屏障，可以增加nowait子句到相應(yīng)的編譯指導(dǎo)語(yǔ)句中,,,明確的同步屏障語(yǔ)句,在有些情況下，隱含的同步屏障并不能提供有效的同步措施程序員可以在需要的地方插入明確的同步屏障語(yǔ)句#pragma omp barrier 在并行區(qū)域的執(zhí)行過(guò)程中，所有的執(zhí)行線程都會(huì)在同步屏障語(yǔ)句上進(jìn)行同步 #pragma omp parallel{initialization（）;#pragma omp barrierprocess（）;

25、},,,,,循環(huán)并行化中的順序語(yǔ)句（ordered）,對(duì)于循環(huán)并行化中的某些處理需要規(guī)定執(zhí)行的順序典型的情況：在一次循環(huán)的過(guò)程中一大部分的工作是可以并行執(zhí)行的，而其余的工作需要等到前面的工作全部完成之后才能夠執(zhí)行在循環(huán)并行化的過(guò)程中，可以使用ordered子句使得順序執(zhí)行的語(yǔ)句直到前面的循環(huán)都執(zhí)行完畢之后再執(zhí)行,,,OpenMP任務(wù)調(diào)度,OpenMP中，任務(wù)調(diào)度主要用于并行的for循環(huán)中，當(dāng)循環(huán)中每次迭代的計(jì)算量不相等時(shí)，如果

26、簡(jiǎn)單地給各個(gè)線程分配相同次數(shù)的迭代的話，會(huì)造成各個(gè)線程計(jì)算負(fù)載不均衡，這會(huì)使得有些線程先執(zhí)行完，有些后執(zhí)行完，造成某些CPU核空閑，影響程序性能。,int i, j;int a[100][100] = {0};for ( i =0; i < 100; i++){for( j = i; j < 100; j++ ){ a[i][j] = i*j;}} 如果將最外層循環(huán)

27、并行化的話，比如使用4個(gè)線程，如果給每個(gè)線程平均分配25次循環(huán)迭代計(jì)算的話，顯然i＝0和i＝99的計(jì)算量相差了100倍，那么各個(gè)線程間可能出現(xiàn)較大的負(fù)載不平衡情況。,for循環(huán)并行化的任務(wù)調(diào)度方案,schedule子句的使用格式為：schedule(type[,size])type參數(shù)表示調(diào)度類型，有四種調(diào)度類型如下：· static· dynamic· guided·&

28、#160;runtime (實(shí)際上是根據(jù)環(huán)境變量來(lái)選擇前三種中的某中類型。)size參數(shù) (可選) size參數(shù)表示循環(huán)迭代次數(shù)，size參數(shù)必須是整數(shù)。,靜態(tài)調(diào)度(static),當(dāng)parallel for編譯制導(dǎo)語(yǔ)句沒(méi)有帶schedule子句時(shí)，大部分系統(tǒng)中默認(rèn)采用static調(diào)度方式，這種調(diào)度方式非常簡(jiǎn)單。假設(shè)有n次循環(huán)迭代，t個(gè)線程，那么給每個(gè)線程靜態(tài)分配大約n/t次迭代計(jì)算。不使用size參數(shù)時(shí)，分配給每個(gè)線程的是n/

29、t次連續(xù)的迭代,#pragma omp parallel for schedule(static) for(i = 0; i < 10; i++ ) { printf("i=%d, thread_id=%d\n", i, omp_get_t

30、hread_num());},i=0, thread_id=0i=1, thread_id=0i=2, thread_id=0i=3, thread_id=0i=4, thread_id=0i=5, thread_id=1i=6, thread_id=1i=7, thread_id=1i=8, thread_id=1i=9, thread_id=1可以看出線程0得到了0～4次連續(xù)迭代，線程1得到5～9次連續(xù)迭代。,

31、#pragma omp parallel for schedule(static, 2) for(i = 0; i < 10; i++ ) { printf("i=%d, thread_id=%d\n", i, omp_get_thread

32、_num());},i=0, thread_id=0i=1, thread_id=0i=4, thread_id=0i=5, thread_id=0i=8, thread_id=0i=9, thread_id=0i=2, thread_id=1i=3, thread_id=1i=6, thread_id=1i=7, thread_id=10、1次迭代分配給線程0,每個(gè)線程依次分配到2次連續(xù)的迭代計(jì)算。,動(dòng)態(tài)調(diào)度(d

33、ynamic),動(dòng)態(tài)調(diào)度是動(dòng)態(tài)地將迭代分配到各個(gè)線程，動(dòng)態(tài)調(diào)度可以使用size參數(shù)也可以不使用size參數(shù)，不使用size參數(shù)時(shí)是將迭代逐個(gè)地分配到各個(gè)線程，使用size參數(shù)時(shí)，每次分配給線程的迭代次數(shù)為指定的size次。使用一個(gè)內(nèi)部任務(wù)隊(duì)列，采用先來(lái)先服務(wù)的方式進(jìn)行調(diào)度。當(dāng)某個(gè)線程閑下來(lái)，就為其分配一個(gè)循環(huán)塊。由此可見(jiàn)，動(dòng)態(tài)策略可以極大地保證線程組的負(fù)載平衡，但是需要額外的開(kāi)銷，不能達(dá)到最佳性能。,guided調(diào)度（guided）,

34、guided調(diào)度是一種采用指導(dǎo)性的啟發(fā)式自調(diào)度方法。開(kāi)始時(shí)每個(gè)線程會(huì)分配到較大的迭代塊，之后分配到的迭代塊會(huì)逐漸遞減。迭代塊的大小會(huì)按指數(shù)級(jí)下降到指定的size大小，如果沒(méi)有指定size參數(shù)，那么迭代塊大小最小會(huì)降到1。,runtime調(diào)度（rumtime）,runtime調(diào)度并不是和前面三種調(diào)度方式似的真實(shí)調(diào)度方式，它是在運(yùn)行時(shí)根據(jù)環(huán)境變量OMP_SCHEDULE來(lái)確定調(diào)度類型例如在unix系統(tǒng)中，可以使用setenv命令來(lái)設(shè)置O

眾賞文庫(kù)> 全部分類> 畢業(yè)設(shè)計(jì)

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

并行區(qū)域

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

并行區(qū)域

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

免費(fèi)下載