回歸分析課程設(shè)計(jì)--主成分回歸分析_第1頁(yè)
已閱讀1頁(yè),還剩11頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、<p><b>  課程設(shè)計(jì)報(bào)告</b></p><p>  ( 2011 -- 2012 年度第2學(xué)期)</p><p>  名 稱(chēng): 應(yīng)用回歸分析課程設(shè)計(jì) </p><p>  題 目: 主成分回歸分析 </p><p>  院 系: 理學(xué)院

2、 </p><p>  班 級(jí): 10統(tǒng)計(jì)1 </p><p>  學(xué) 號(hào): 1011112128 </p><p>  學(xué)生姓名: 丁玉花 </p><p>  指導(dǎo)教師: 商豪 </p><p&g

3、t;  設(shè)計(jì)周數(shù): 1周 </p><p>  成 績(jī): </p><p>  日期: 2012 年 5月 28 日</p><p>  氮磷鉀的施肥量對(duì)生菜產(chǎn)量的影響分析</p><p><b>  摘要:</b></p&

4、gt;<p>  氮磷鉀是大部分肥料的主要成分,為了了解這三種元素的施肥量和農(nóng)作物的產(chǎn)量之間是否存在著一定的關(guān)系,并希望通過(guò)分析能夠?qū)⒔Y(jié)果應(yīng)用于實(shí)際,幫農(nóng)民找到三種元素的恰當(dāng)合適施肥量組合。本文收集了共30組氮磷鉀三種元素的施肥量與生菜產(chǎn)量的數(shù)據(jù)。以氮磷鉀的施肥量為自變量,生菜的產(chǎn)量為因變量,運(yùn)用回歸分析的辦法,研究了這之間的關(guān)系。</p><p>  結(jié)果:得到了各個(gè)變量關(guān)于生菜產(chǎn)量的主成分回歸方

5、程: y^=0.263x1+0.295x2+1.460x3+0.314a+0.3450c+1.479d</p><p>  分析:通過(guò)得到的方程,如果已知氮磷鉀三種元素的施肥量就可以用回歸方程來(lái)估算在這種組合下生菜的生產(chǎn)量。例如:</p><p>  鉀的施肥量(x1)為320Kg/ha,氮的施肥量(x2)為220Kg/ha,磷的施肥量(x3)為260Kg/ha,則可得出生菜的產(chǎn)量(y)為

6、149.361t/ha。</p><p>  關(guān)鍵詞: 氮磷鉀 施肥量 產(chǎn)量 主成分回歸分析 偏相關(guān)系數(shù)</p><p><b>  1引言:</b></p><p>  氮磷鉀三種元素是大部分肥料的主要成分,為了了解三種元素的施肥量與農(nóng)作物產(chǎn)量之間的關(guān)系,收集了30組氮磷鉀的施肥量與生菜的產(chǎn)量的數(shù)據(jù),并用曲線回歸分析的方法對(duì)數(shù)據(jù)進(jìn)行分析,發(fā)現(xiàn)

7、氮磷鉀施肥量與剩菜產(chǎn)量之間是有一定的規(guī)律可循的。</p><p>  1.1 收集到的數(shù)據(jù):</p><p>  K、N、P分別代表氮、磷、鉀三種元素。施肥量的單位均為Kg/ha(千克/公頃),生菜產(chǎn)量的單位為t/ha(噸/公頃)。</p><p>  2偏相關(guān)分析和主成分回歸分析</p><p><b>  2.1篇相關(guān)分析<

8、;/b></p><p>  偏相關(guān)分析用以計(jì)算描述在其他變量控制下,兩變量之間的線性關(guān)系的偏相關(guān)系數(shù),即各個(gè)因素對(duì)生菜產(chǎn)量的直接影響程度,也就是說(shuō)在除去其他因素的影響后,每個(gè)因素對(duì)生菜產(chǎn)量的凈影響。運(yùn)用sas統(tǒng)計(jì)軟件分別計(jì)算出偏相關(guān)系數(shù)。</p><p>  生菜的產(chǎn)量y與鉀的施肥量x1、氮的施肥量x2、磷的施肥量x3,、鉀施肥量的平方、氮施肥量的平方、磷施肥量的平方d的偏向關(guān)系為

9、:</p><p>  R(y,x1)= 0.10605 P=0.5770,</p><p>  可見(jiàn)控制因素x2、x3、a、c、d時(shí),生菜的產(chǎn)量(y)與鉀的施肥量(x1)的偏相關(guān)系數(shù)不明顯。</p><p>  R(y,x2)= 0.19794 P=0.2944,</p><p>  可見(jiàn)控制因素x1、x3、a、c、d時(shí),生菜的產(chǎn)量(

10、y)與氮的施肥量(x2)的偏相關(guān)系數(shù)不明顯。</p><p>  R(y,x3)= 0.70656 P=<.0001 ,</p><p>  可見(jiàn)控制因素x1、x3、a、c、d時(shí),生菜的產(chǎn)量(y)與氮的施肥量(x3)的偏相關(guān)系數(shù)顯著。</p><p>  R(y,a)=0.12636 P= 0.5058 ,</p><p&g

11、t;  可見(jiàn)控制因素x1、x2、x3、c、d時(shí),生菜的產(chǎn)量(y)與氮的施肥量(a)的偏相關(guān)系數(shù)不明顯。</p><p>  R(y,c)= 0.06218 P= 0.7441 ,</p><p>  可見(jiàn)控制因素x1、x2、x3、c、d時(shí),生菜的產(chǎn)量(y)與氮的施肥量(c)的偏相關(guān)系數(shù)不明顯。</p><p>  R(y,d)= 0.64312 P

12、= 0.0001,</p><p>  可見(jiàn)控制因素x1、x2、x3、c、a時(shí),生菜的產(chǎn)量(y)與氮的施肥量(d)的偏相關(guān)系數(shù)顯著。</p><p>  2.2主成分回歸分析</p><p>  主成分回歸分析是將原來(lái)的多個(gè)變量綜合成彼此互補(bǔ)相關(guān)的綜合指標(biāo)(即主成分)的一種統(tǒng)計(jì)方法,可以達(dá)到數(shù)據(jù)化簡(jiǎn),揭示變量不僅保留了原始數(shù)據(jù)的絕大部分信息,而且彼此之間不相關(guān),對(duì)綜

13、合變量進(jìn)行分析,可以抓住主要的因素,剔除一些重疊的信息使問(wèn)題得到最佳綜合簡(jiǎn)化。</p><p>  利用sas 軟件計(jì)算出9各變量之間的相關(guān)系矩陣,發(fā)現(xiàn)變量之間的相關(guān)性比較明顯,為此對(duì)9各變量的原始標(biāo)準(zhǔn)化數(shù)據(jù)進(jìn)行主成分分析。有輸出的結(jié)果可知,相關(guān)矩陣的前3個(gè)特征根分別為1=1.98004869,2= 1.97957071,3=1.8473516。前三個(gè)主成分的累計(jì)貢獻(xiàn)率高達(dá)96.78%,所以選取三個(gè)主成分來(lái)代替原

14、來(lái)的9個(gè)變量,這三個(gè)主成分可以解釋原來(lái)的96.78%的信息。主成分個(gè)數(shù)的確定,根據(jù)累計(jì)方差貢獻(xiàn)率大于或等于85%的原則選取。用Z1,Z2,Z3表示這三個(gè)主成分,則:</p><p>  Z1=0.503138x1-0.510496x2+0.007638x3+0.489430a-0.496579c+0.007427d</p><p>  Z2=-0.298940x1-0.285881x2+0

15、.585388x3-0.290879a-0.278166c+0.569422d</p><p>  Z3=0.396302x1+0.396527x2+0.396022x3+0.419853a+0.420073c+0.419690d</p><p>  2.3 曲線回歸分析</p><p>  回歸分析是研究一個(gè)因變量和一個(gè)或多個(gè)自變量之間的依賴(lài)關(guān)系的一種統(tǒng)計(jì)方法。通

16、過(guò)對(duì)具體關(guān)系的確立來(lái)建立一個(gè)合適的數(shù)學(xué)模型,以便從以質(zhì)量來(lái)推斷未知量。在本問(wèn)題中,普通的線性回歸所得出的模型不能夠很好擬合實(shí)際情況,于是采用曲線回歸分析方法進(jìn)行分析。所采用的是可化為線性的曲線回歸分析方法。</p><p>  利用前三個(gè)主成分作為回歸自變量,和生菜的生產(chǎn)量進(jìn)行多元曲線回歸分析,可得到如下回歸方程:</p><p>  y=-0.01384z1+1.34706z2+1.69

17、694z3</p><p>  F= 30.33 ,P<.0001說(shuō)明此回歸方程是高度顯著的。</p><p>  最后轉(zhuǎn)化為y 與原始變量的多元回歸式:</p><p>  y^=0.26284716956x1+0.29484893216x2+1.46047262204x3+0.31386017288a+0.34500503802c+1.4791315582

18、4d</p><p>  省略到小數(shù)點(diǎn)后三位數(shù):</p><p>  y^=0.263x1+0.295x2+1.460x3+0.314a+0.3450c+1.479d</p><p>  在以上的回歸方程中y是生菜的產(chǎn)量y(t/ha),鉀的施肥量x1(Kg/ha),氮的施肥量x2(Kg/ha),磷的施肥量x3(Kg/ha), 鉀施肥量的平方a(Kg/ha),氮施肥量

19、的平方c(Kg/ha),磷施肥量的平方d(Kg/ha)。</p><p>  3分析結(jié)論及相關(guān)建議:</p><p>  通過(guò)得到的方程,如果已知氮磷鉀三種元素的施肥量就可以用回歸方程來(lái)估算在這種組合下生菜的生產(chǎn)量。例如:</p><p>  鉀的施肥量(x1)為320Kg/ha,氮的施肥量(x2)為220Kg/ha,磷的施肥量(x3)為260Kg/ha,則可得出生

20、菜的產(chǎn)量(y)為149.361t/ha。</p><p><b>  4參考文獻(xiàn):</b></p><p>  何曉群、劉文卿《應(yīng)用回歸分析》第二版;</p><p>  王芳、陳勝可、馮國(guó)生等編者《SAS統(tǒng)計(jì)分析與應(yīng)用》;</p><p>  全國(guó)數(shù)學(xué)建模大賽1992年題目數(shù)據(jù);</p><p>

21、;  5編寫(xiě)程序及相關(guān)結(jié)果:</p><p><b>  程序:</b></p><p><b>  建立數(shù)據(jù)集:</b></p><p>  將事先準(zhǔn)備好的數(shù)據(jù)通過(guò)EXCEL導(dǎo)入SAS中,保存為sasuser.pro。</p><p>  %對(duì)數(shù)據(jù)集進(jìn)行處理:</p><p&g

22、t;  data pro2;</p><p>  set sasuser.pro;</p><p>  a=x1*x3;c=x1*x2; d=x2*x3; e=x1*x1; f=x2*x2; g=x3*x3;</p><p><b>  run;</b></p><p><b>  run;</b>

23、</p><p>  %對(duì)數(shù)據(jù)進(jìn)行偏相關(guān)系數(shù)</p><p>  proc corr data=pro2;</p><p>  var x1 x2 x3 a c d;</p><p><b>  run;</b></p><p>  %對(duì)數(shù)據(jù)進(jìn)行方差分析,并求出方差擴(kuò)大因子和條件數(shù)</p&g

24、t;<p>  model y= x1 x2 x3 a c d e f g/vif collin;</p><p>  plot r.*y;</p><p><b>  run;</b></p><p><b>  %主成分回歸: </b></p><p>  Proc princom

25、p data=pro2 out=c prefix=z;</p><p>  Var x1 x2 x3 a c d e f g;</p><p><b>  run;</b></p><p>  Proc reg data=c;</p><p>  model y=z1-z3; </p><p>

26、<b>  Run;</b></p><p><b>  結(jié)果:</b></p><p>  偏相關(guān)系數(shù): The CORR Procedure </p><p>  7 Variables:

27、 y x1 x2 x3 a c d </p><p>  Simplestatistic </p><p>  Variable

28、 N Mean Std Dev Sum Minimum Maximum Label </p><p>  y 30 17.13633 4.18305 514.09000 6.39000 24.53000 生菜的產(chǎn)量 </p><

29、;p>  x1 30 341.03333 132.77372 10231 0 651.00000 鉀的施肥量 </p><p>  x2 30 205.33333 79.98850 6160 0 392.00000 氮的施肥量 &

30、lt;/p><p>  x3 30 358.53333 139.64209 10756 0 685.00000 磷的施肥量 </p><p>  a 30 133345 82994 4000349 0 423

31、801 </p><p>  c 30 48347 30096 1450400 0 153664 </p><p>  d 30 147396 91848 442188

32、2 0 469225 </p><p>  Pearson Correlation Coefficients, N = 30 </p><p>  Prob > |r| under H0: Rho=0

33、 </p><p>  y x1 x2 x3 a c d </p><p>  y 1.00000 0.10605 0.19794 0.70656 0.12636 0.06218 0.6431

34、2 </p><p>  生菜的產(chǎn)量 0.5770 0.2944 <.0001 0.5058 0.7441 0.0001 </p><p>  x1 0.10605 1.00000 -0.05630 -0.05610 0.93498 -

35、0.01467 -0.01441 </p><p>  鉀的施肥量 0.5770 0.7676 0.7684 <.0001 0.9387 0.9398 </p><p>  x2 0.19794 -0.05630 1.00000 -0.0561

36、3 -0.01466 0.93494 -0.01442 </p><p>  氮的施肥量 0.2944 0.7676 0.7683 0.9387 <.0001 0.9397 </p><p>  x3 0.70656 -0.05610 -

37、0.05613 1.00000 -0.01460 -0.01462 0.93481 </p><p>  磷的施肥量 <.0001 0.7684 0.7683 0.9390 0.9389 <.0001 </p><p>  a 0.1

38、2636 0.93498 -0.01466 -0.01460 1.00000 -0.00382 -0.00375 </p><p>  0.5058 <.0001 0.9387 0.9390 0.9840 0.9843 </p><p>  c

39、 0.06218 -0.01467 0.93494 -0.01462 -0.00382 1.00000 -0.00375 </p><p>  0.7441 0.9387 <.0001 0.9389 0.9840 0.9843 </p><p>  d

40、 0.64312 -0.01441 -0.01442 0.93481 -0.00375 -0.00375 1.00000 </p><p>  0.0001 0.9398 0.9397 <.0001 0.9843 0.9843 </p><p>

41、;  The SAS System 21:34 Friday, June 2, 2012 40</p><p><b>  方差分析,</b></p><p>  Analysis of Variance </p><p>  Sum of

42、 Mean </p><p>  Source DF Squares Square F Value Pr > F </p><p>  Model 6 435

43、.90091 72.65015 23.36 <.0001 </p><p>  Error 23 71.53759 3.11033 </p><p>  Corrected Total 29

44、 507.43850 </p><p>  Root MSE 1.76361 R-Square 0.8590 </p><p>  Dependent Mean 17.13633 Adj R

45、-Sq 0.8222 </p><p>  Coeff Var 10.29166 </p><p>  Parameter Estimates &

46、lt;/p><p>  Parameter Standard Variance </p><p>  Variable Label DF Estimate Error t Value Pr > |t| Inflation &l

47、t;/p><p>  Intercept Intercept 1 -7.49815 2.71107 -2.77 0.0110 0 </p><p>  x1 鉀的施肥量 1 0.02575 0.00768 3.35 0.0028

48、 9.69648 </p><p>  x2 氮的施肥量 1 0.09325 0.01275 7.32 <.0001 9.69059 </p><p>  x3 磷的施肥量 1 0.04563 0.00729 6.26 <.

49、0001 9.67133 </p><p>  a 1 -0.00003016 0.00001206 -2.50 0.0199 9.33843 </p><p>  c 1 -0.00021903 0.00003324

50、 -6.59 <.0001 9.33244 </p><p>  d 1 -0.00003422 0.00001088 -3.14 0.0045 9.31563 </p><p>  特征根和累計(jì)貢獻(xiàn)量:

51、 </p><p>  Eigenvalues of the Correlation Matrix </p><p>  Eigenvalue Difference Proportion Cumulative </p><p>  1 1.

52、98004869 0.00047797 0.3300 0.3300 </p><p>  2 1.97957071 0.13221903 0.3299 0.6599 </p><p>  3 1.84735169 1.767141

53、67 0.3079 0.9678 </p><p>  4 0.08021002 0.00013791 0.0134 0.9812 </p><p>  5 0.08007212 0.04732535 0.0133

54、 0.9945 </p><p>  6 0.03274677 0.0055 1.0000 </p><p>  主成分回歸及其檢驗(yàn): </p><p>  Eigenvectors

55、 </p><p>  z1 z2 z3 z4 z5 z6 </p><p>  x1 鉀的施肥量 0.503138 -.298940 0.396302 -.226828 -.521772

56、 0.420398 </p><p>  x2 氮的施肥量 -.510496 -.285881 0.396527 -.337847 0.458049 0.420098 </p><p>  x3 磷的施肥量 0.007638 0.585388 0.396022 0.566246

57、 0.064295 0.419119 </p><p>  a 0.489430 -.290879 0.419853 0.233250 0.536408 -.396778 </p><p>  c -.496579 -.278166 0.

58、420073 0.347389 -.470865 -.396458 </p><p>  d 0.007427 0.569422 0.419690 -.581970 -.066064 -.395614 </p><p>  The SAS System 2

59、1:34 Friday, June 2, 2012 </p><p>  The REG Procedure </p>

60、<p>  Model: MODEL1 </p><p>  Dependent Variable: y 生菜的產(chǎn)量 </p><p>  Analysis of Variance </p>&

61、lt;p>  Sum of Mean </p><p>  Source DF Squares Square F Value Pr > F </p><p>  Model

62、 3 258.44988 86.14996 9.00 0.0003 </p><p>  Error 26 248.98862 9.57649 </p><p>  Corrected Total

63、 29 507.43850 </p><p>  Root MSE 3.09459 R-Square 0.5093 </p><p>  Dependent Mean 17.

64、13633 Adj R-Sq 0.4527 </p><p>  Coeff Var 18.05865 </p><p>  Parameter Estimates

65、 </p><p>  Parameter Standard </p><p>  Variable Label DF Estimate Error t Value Pr > |t|

66、 Intercept Intercept 1 17.13633 0.56499 30.33 <.0001 z1 1 -0.01384 0.40838 -0.03

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論