sas在統(tǒng)計(jì)中的應(yīng)用_第1頁(yè)
已閱讀1頁(yè),還剩30頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、SAS統(tǒng)計(jì)軟件應(yīng)用,一、SAS和SPSS簡(jiǎn)介二、Excel、SPSS、 SAS的比較三、SAS編程基礎(chǔ),一、SAS和SPSS簡(jiǎn)介,SAS:“Statistical Analysis System” SAS是美國(guó)使用最為廣泛的三大著名統(tǒng)計(jì)分析軟件(SAS,SPSS和SYSTAT)之一,是目前國(guó)際上最為流行的一種大型統(tǒng)計(jì)分析系統(tǒng),被譽(yù)為統(tǒng)計(jì)分析的標(biāo)準(zhǔn)軟件。在我國(guó),國(guó)家信息中心、國(guó)家統(tǒng)計(jì)局、衛(wèi)生部、中國(guó)科學(xué)院等都是SAS系統(tǒng)的大用戶。

2、 SAS以被廣泛應(yīng)用于政府行政管理、科研、教育、運(yùn)輸、通訊、生產(chǎn)和金融等不同領(lǐng)域,并且發(fā)揮著愈來愈重要的作用。,,SPSS:Statistical Package for the Social Sciences “社會(huì)科學(xué)統(tǒng)計(jì)軟件包”。 SPSS:Statistical Product and Service Solutions “統(tǒng)計(jì)產(chǎn)品與服務(wù)方案”,2000年通訊、醫(yī)療、銀行、證券、保險(xiǎn)、制造、商業(yè)、市場(chǎng)研究、科研教育等多

3、個(gè)領(lǐng)域和行業(yè),是世界上應(yīng)用最廣泛的專業(yè)統(tǒng)計(jì)軟件。,二、Excel、SPSS、 SAS的比較,Excel、SPSS和SAS軟件都能進(jìn)行一般統(tǒng)計(jì)分析,但各有其優(yōu)缺點(diǎn)。 Excel軟件的統(tǒng)計(jì)分析功能雖然沒有SPSS和SAS軟件的功能強(qiáng)大,但由于其使用的普遍性、簡(jiǎn)便性及靈活性,使它在處理少數(shù)變量時(shí)具有優(yōu)越性。SPSS由于操作簡(jiǎn)便,菜單式的操作界面,初學(xué)者容易掌握,在進(jìn)行多變量的顯著性檢驗(yàn)方面具有優(yōu)勢(shì)性。SAS雖然功能強(qiáng)大,可隨用戶隨心所欲

4、,尤其在最小二乘分析方面具有獨(dú)特優(yōu)勢(shì)。但由于需要通過一定的學(xué)習(xí)才能掌握SAS的使用和編程,往往使初學(xué)者望而卻步。,Excel、SPSS、 SAS的比較,三、SAS編程基礎(chǔ),(一)SAS系統(tǒng)的窗口 SAS系統(tǒng)啟動(dòng)后有三個(gè)窗口:1. OUTPUT――SAS結(jié)果輸出窗口2. LOG―――SAS日志窗口3. PGM―――SAS程序編輯窗口program editor 在PGM窗口中,按F4→調(diào)回程序,按F8(或“小人”圖標(biāo))→運(yùn)行

5、程序。程序的輸入、修改調(diào)試和運(yùn)行:SAS程序只能在PGM窗口輸入、修改。,(一) SAS數(shù)據(jù)集、常量、變量與觀測(cè),1 SAS數(shù)據(jù)集(SAS Dataset)是SAS過程的數(shù)據(jù)基礎(chǔ),只有SAS數(shù)據(jù)集中的數(shù)據(jù)才能被使用。數(shù)據(jù)集含兩部分內(nèi)容: (1) 描述部分: 數(shù)據(jù)名稱、類型、長(zhǎng)度、格式等。(2) 數(shù)據(jù)部分: 包含實(shí)際數(shù)據(jù)值。SAS數(shù)據(jù)值被安排在一個(gè)矩陣式的表狀結(jié)構(gòu)中。2 觀測(cè)(Obse

6、rvation) 描述被觀測(cè)對(duì)象的單一整體(如個(gè)別人、一個(gè)實(shí)驗(yàn)動(dòng)物等)某些特性的一系列數(shù)據(jù)值稱為一個(gè)觀測(cè),又稱觀察。在SAS數(shù)據(jù)集中每一行數(shù)據(jù)是一個(gè)觀測(cè)。,例如:,SAS數(shù)據(jù)集:DATA CLASS; INPUT NAME $1-11 SEX $ AGE GHIGHT WHIGHT; CARDS; Zhangling m 38 172.4 61.5 Wangqang m 41 169.2 64.4

7、 … Tongling m 34 170.4 58.9 ;Run;,,,3 變量(Variable)變量指定了數(shù)據(jù)的某一特性。在SAS數(shù)據(jù)集中,每一個(gè)觀測(cè)是由各個(gè)變量的數(shù)據(jù)值組成。在數(shù)據(jù)集中每一列數(shù)據(jù)是一個(gè)變量。 (1) 變量的命名最多8個(gè)字符長(zhǎng),第一個(gè)字符必須是字母或者下劃線,不能有空格。特殊字符(如$,@,#)也不允許在SAS名中使用。合法變量名如:A A1 abc

8、 name age total …,變量特性變量的特性兩種類型數(shù)值型和字符型(名后用一“$”號(hào)來表示)。長(zhǎng)度特性:是指存貯的字節(jié)數(shù)。缺省長(zhǎng)度是8變量的特性的定義:明確地說明或者在首次出現(xiàn)時(shí)給出定義。例如: DATA A; C='BAD'; PUT C;

9、 C='GOOD'; PUT C; RUN;,(3) 變量清單的簡(jiǎn)化表示在許多語(yǔ)句中可使用縮寫變量清單形式。如: INPUT NAME $ x1 x2 x3 x4 x5 x6;可以寫成:INPUT NAME $ x1-x6; 注意: 字符型變量NAME不包含在這個(gè)縮寫清單中。縮寫的這些變量

10、要求類型相同,或全是數(shù)值型的或全是字符型的。,(4). 缺項(xiàng)值 當(dāng)一個(gè)變量由于某種原因沒有得到(可能沒有觀測(cè)到,或由于數(shù)據(jù)錯(cuò)誤,或由于計(jì)算錯(cuò)誤),稱該值為缺項(xiàng)值(又稱缺失值)。在SAS中用“.”表示。,4 常量 (Constant),SAS常量為值固定不變的量常量分為以下三類:數(shù)值常量:1.5 -2.79 1.75E-5字符常量:“Hello” “ABC” “Zhangl

11、i”日期、時(shí)間、日期時(shí)間常量:后接D,T,DT‘1JAN2000’D‘9:25:19’T‘1JAN2000:10:30:05’DT,(二) SAS函數(shù),函數(shù)是一個(gè)功能模塊,包括三個(gè)要素:函數(shù)名、參數(shù)、返回值函數(shù)的作用為:根據(jù)參數(shù)計(jì)算函數(shù)值并返回。例:y = SUM ( 1, 2, 3) ;函數(shù)名:SUM參數(shù):1, 2, 3返回值:6 (函數(shù)運(yùn)算結(jié)果)參數(shù)格式:1.用逗號(hào)分割:SUM(x1,

12、 x2, x3)2. 用簡(jiǎn)化形式:SUM(OF x1-x3)3.用列表形式:SUM(OF x1 x2 x3),(二)SAS程序結(jié)構(gòu),在SAS系統(tǒng)中,任何一個(gè)完整的處理過程均可分為兩大步完成,即數(shù)據(jù)步和過程步。數(shù)據(jù)步:將不同來源的數(shù)據(jù)讀入SAS系統(tǒng)建立起SAS數(shù)據(jù)集。每一個(gè)數(shù)據(jù)步均由DATA語(yǔ)句開始,以RUN語(yǔ)句結(jié)束。過程步:調(diào)用各種已編好的過程,處理和分析由數(shù)據(jù)步建立的數(shù)據(jù)集中的數(shù)據(jù)。每一過程步均以PRO

13、C語(yǔ)句開始,以RUN語(yǔ)句結(jié)束。每個(gè)語(yǔ)句均以“;”結(jié)束。,例1:,data samp; a=50; b=120*a; c=240*b; d=360*c;run;proc print;run;,F4----召回程序F8---運(yùn)行程序(RUN),SAS程序的輸入、修改和運(yùn)行---在PRG窗口每行以“;”結(jié)束,例2,options linesize=76;data maize;inp

14、ut weight @@;diff=weight-300;cards;308 305 311 298315 300 321 294320;proc means n t prt;var diff;run;,The SAS System 121:51 Tuesday, November 11, 1997Analysis Variable : DIFFN

15、T Prob>|T|---------------------------------9 2.4954012 0.0372---------------------------------,樣本平均數(shù)與總體平均數(shù)的差異顯著性檢驗(yàn)總體平均數(shù)μ=300,例3:,data ex;do a=1 to 2; do b=1 to 2; do r=1 to 3; input g@@;

16、 output; end; end;end;drop r;,cards;34.5 35.1 33.8 40.3 42.5 24.6 16.827.5 33.5 31.6 34.7 41.0 27.6 22.420.2 24.8 20.6 22.3 16.5 20.4 25.528.2 11.9 23.4 20.9 24.9 14.6 13.5;proc print;proc g

17、lm;class a b;model g=a|b;lsmeans a|b/stderr pdiff tdiff;means a b/snk duncan alpha=0.01;run;,(三)SAS程序中的語(yǔ)句,DATA語(yǔ)句:DATA [數(shù)據(jù)集名] [選擇項(xiàng)] ; 表示數(shù)據(jù)步開始,并指明所要建立的數(shù)據(jù)集名稱。INPUT語(yǔ)句:INPUT [指定變量名,…..] ; 指明數(shù)據(jù)的變量名

18、、順序和類型。CARDS語(yǔ)句:表明數(shù)據(jù)行開始,放在數(shù)據(jù)前,其它語(yǔ)句后。OUTPUT語(yǔ)句:將數(shù)據(jù)矢量中的內(nèi)容寫入數(shù)據(jù)集。INFILE語(yǔ)句:INFILE ‘路徑:文件名+擴(kuò)展名’;(調(diào)入外部數(shù)據(jù)文件)CLASS語(yǔ)句:變量分類循環(huán)語(yǔ)句:DO … END; 根據(jù)控制變量的變化來進(jìn)行循環(huán)。,(四)SAS程序中的過程,1、t 檢驗(yàn),(1)單一樣本平均數(shù)與總體平均數(shù)的差異t檢驗(yàn),DATA A;INPUT y

19、@@;y=y-114;CARDS;116 115 113 112 114 117 115 116 114 113;PROC MEANS N MEAN STDERR T PRT;RUN;,The SAS System 2 21:51 Tuesday, November 11, 1997Analysis Variable : Yn Mean S

20、td Error T Prob>|T|------------------------------------------------------10 0.5000 0.5000 1.0000 0.3434------------------------------------------------------,(2)兩樣本 配對(duì)試驗(yàn)資料的t 檢驗(yàn),DATA B;INPUT ID x1 x

21、2;d=x1-x2;CARDS;1 37.8 37.9 2 38.2 39.03 38.0 38.94 37.6 38.45 37.9 37.96 38.1 39.07 38.2 39.58 37.5 38.69 38.5 38.810 37.9 39.0;PROC MEANS MEAN STDERR T PRT; VAR d;RUN;,The

22、 SAS System 21:19 Tuesday, November 11, 1997 1Analysis Variable : DMean Std Error T Prob>|T|-------------------------------------------------------------0.7300000 0.1406730 -5.1893403 0.000

23、6------------------------------------------------------------,(3)兩樣本 非配對(duì)試驗(yàn)資料的t檢驗(yàn),DATA C;INPUT breed y@@;CARDS;1 1.20 2 2.001 1.32 2 1.851 1.10 2 1.601 1.28 2 1.78 1 1.35 2 1.961 1.08 2 1.88

24、1 1.18 2 1.821 1.25 2 1.701 1.30 2 1.681 1.12 2 1.921 1.19 2 1.801 1.05;PROC TTEST;CLASS breed;VAR y;RUN;,TTEST PROCEDUREVariable: YBREED N Mean Std Dev Std Error--

25、----------------------------------------------------------------1 12 1.20166667 0.09980284 0.028810602 11 1.81727273 0.12280805 0.03702802Variances T DF Prob>

26、|T|----------------------------------------------------------Unequal -13.1214 19.3 0.0001Equal -13.2443 21.0 0.0000For H0: Variances are equal, F' = 1.51 DF = (10,11) Prob>F' =

27、0.5058,2 方差分析,(1)ANOVA過程的程序格式PROC ANOVA 選項(xiàng);CLASS 變量;MODEL 依變量=效應(yīng)/選項(xiàng);MEANS 效應(yīng)/選項(xiàng);,指明分類變量,此語(yǔ)句一定要設(shè)定,并且應(yīng)出現(xiàn)在MODEL語(yǔ)句之前,定義分析所用的線性數(shù)學(xué)模型,MEANS語(yǔ)句計(jì)算各處理效應(yīng)的平均數(shù),“選項(xiàng)”用于設(shè)定多重比較方法----常用的有LSD法、DUNCAN法、TUKEY法等顯著水平的確定采用如ALPHA=0.01(表示將顯

28、著水平設(shè)定為0.01),缺省為0.05。,上述語(yǔ)句中,關(guān)鍵在于定義線性數(shù)學(xué)模型。同一試驗(yàn)資料,根據(jù)模型不同而異。常用的模型定義語(yǔ)句有:MODEL y=a(單因素試驗(yàn)資料的方差分析)MODEL y=a b(兩因素試驗(yàn)資料無互作模型)MODEL y=a b c(三因素主效模型)MODEL y=a b a*b(兩因素試驗(yàn)資料有互作模型,也可寫成y=a|b)MODEL y=a b(a)(兩因素試驗(yàn)資料嵌套模型,用于系統(tǒng)分組資料)M

29、ODEL y1 y2=a b(兩元兩因素主效模型)。結(jié)果輸出包括分類變量信息表、方差分析表和多重比較表等。,,(2)GLM過程的程序格式PROC GLM 選項(xiàng);CLASS 變量;MODEL 依變量=效應(yīng)/選項(xiàng);MEANS 效應(yīng)/選項(xiàng);RANDOM 效應(yīng)/選項(xiàng);CONTRAST “對(duì)比說明”效應(yīng) 對(duì)比向量;,通過設(shè)定模型(MODEL)即可對(duì)不同的試驗(yàn)設(shè)計(jì)資料進(jìn)行分析。 當(dāng)處理效應(yīng)為固定效應(yīng)時(shí),通過MEANS語(yǔ)句計(jì)算

30、平均數(shù),進(jìn)行多重比較; 當(dāng)處理效應(yīng)為隨機(jī)效應(yīng)時(shí),可利用RANDOM語(yǔ)句或VARCOMP過程估計(jì)方差分量。,GLM過程的調(diào)用,PROC GLM [選擇項(xiàng)];CLASS 變量(效應(yīng))列表;MODLE 因變量=效應(yīng)列表[/選擇項(xiàng)] [/協(xié)變量列表];,,必須在MODEL語(yǔ)句之前,效應(yīng)列表中的變量必須在CLASS語(yǔ)句中出現(xiàn)過,GLM過程中的可選語(yǔ)句:MEANS 效應(yīng)列表; -----進(jìn)行均數(shù)比較LSMEANS 效應(yīng)列表;

31、 -----進(jìn)行最小二乘分析,3 線性回歸分析,(1)一元線性回歸分析DATA G;INPUT x y @@;CARDS;80 235086 240098 272090 2500120 3150102 268095 263083 2400,113 3080105 2920110 2960100 2860;PROC REG CORR;MODEL y=x / CLM CL

32、I;RUN;,CLM——y總體平均數(shù)的置信區(qū)間CLI——單個(gè)y值的置信區(qū)間。,,數(shù)據(jù)行尾不能有“;”號(hào),數(shù)據(jù)行結(jié)束后,“;”號(hào)必須單獨(dú)占一行,,多條觀測(cè)記錄用一條INPUT語(yǔ)句讀入,,例題:根據(jù)下述某豬場(chǎng)25頭育肥豬4個(gè)胴體性狀的數(shù)據(jù)資料,試進(jìn)行瘦肉量(y)對(duì)眼肌面積(x1)、腿肉量(x2)、腰肉量(x3)的多元線性回歸分析。,,DATA H;INPUT number x1 x2 x3 y@@;CARDS;1

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論