版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、<p><b> 畢業(yè)論文</b></p><p> 某高校在校生體測(cè)成績(jī)的統(tǒng)計(jì)分析</p><p> A STATISTICAL ANALYSIS OF </p><p> COLLEGE STUDENTS THE CERVIX SCORES</p><p><b> 摘 要</b
2、></p><p> 在現(xiàn)代生活中,隨著生活水平的日漸提高,現(xiàn)在大學(xué)生的身體素質(zhì)真是越來(lái)越差了,越是學(xué)歷高的人,身體素質(zhì)普遍就越差。很多人對(duì)身體素質(zhì)這個(gè)詞并不陌生。在日常生活中,人們常說(shuō),誰(shuí)誰(shuí)力氣大,誰(shuí)誰(shuí)跑的快,或者誰(shuí)誰(shuí)很靈活,誰(shuí)誰(shuí)耐久力強(qiáng)。實(shí)際上這些能力都屬于身體素質(zhì)。身體素質(zhì)通常指的是人體在肌肉活動(dòng)中所表現(xiàn)出來(lái)的各種能力。一般包括力量、速度、耐力、靈敏和柔韌。</p><p>
3、 因此,本文通過分析中國(guó)農(nóng)業(yè)大學(xué)2010年6290名在校生體測(cè)成績(jī)數(shù)據(jù),利用matlab統(tǒng)計(jì)分析理論建立相關(guān)模型,研究當(dāng)前大學(xué)生身體素質(zhì)的真實(shí)現(xiàn)狀,該研究成果有著非常重要的應(yīng)用價(jià)值。首先利用描述性統(tǒng)計(jì)分析方法對(duì)體測(cè)數(shù)據(jù)進(jìn)行初步研究。再利用方差分析對(duì)13個(gè)學(xué)院的學(xué)生的身高進(jìn)行單因素一元方差分析和非參數(shù)分析,判斷不同學(xué)院的學(xué)生的身高有無(wú)顯著性差異。在研究身高和體重的關(guān)系時(shí),利用了MATLAN做了回歸模型,用一元回歸求出身高和體重的函數(shù)關(guān)系
4、,二元回歸求出來(lái)身高和體重做自變量,肺活量做因變量的函數(shù)關(guān)系。判別分析主要是用5999個(gè)學(xué)生的身高體重等級(jí)去判別291個(gè)學(xué)生的類別。</p><p> 關(guān)鍵詞:體測(cè)成績(jī); 統(tǒng)計(jì)分析; MATLAB; 方差分析; 回歸分析; 判別分析</p><p><b> ABSTRACT</b></p><p> In the modern life
5、, along with the rising of living standards, college students' physical quality is worse and worse now, the more highly educated people, physical quality general the worse. A lot of people is no stranger to the word
6、physical quality. In daily life, people often say, so-and-so in strength, who can run fast, or who is very flexible, so-and-so strong endurance. In fact these abilities are physical quality. Physical quality usually refe
7、rs to the human body in muscle activity of all</p><p> Therefore, through the analysis of China agricultural university in 2010, 6290 students cervix result data, the relevant model is established using MAT
8、LAB statistic analysis theory, research the real status of the current college students' physical quality, the results of the study has a very important application value. First,use of descriptive statistics analysis
9、 method to a preliminary study on the cervix data. Second, analysis of variance on the height of 13 students of the college on a sing</p><p> Key words:The cervix grades; Statistic Analysis; MATLAB; Analysi
10、s of variance; Analysis of Regression; Discriminant Analysis</p><p><b> 目 錄</b></p><p><b> 1 前 言1</b></p><p> 2 常用統(tǒng)計(jì)分析方法3</p><p> 2.1
11、描述性統(tǒng)計(jì)分析3</p><p> 2.2 方差分析4</p><p> 2.3 回歸分析8</p><p> 2.4 判別分析9</p><p> 3 MATLAB主要統(tǒng)計(jì)函數(shù)簡(jiǎn)介11</p><p> 4 某高校在校生體測(cè)成績(jī)統(tǒng)計(jì)分析13</p><p> 4.1數(shù)據(jù)
12、來(lái)源13</p><p> 4.2描述性統(tǒng)計(jì)量13</p><p> 4.3 方差分析16</p><p> 4.4 回歸分析20</p><p> 4.5判別分析26</p><p> 5 總結(jié)與不足28</p><p><b> 參考文獻(xiàn)29</b&
13、gt;</p><p><b> 致 謝31</b></p><p><b> 附 錄32</b></p><p><b> 1 前 言</b></p><p> 隨著我國(guó)國(guó)力的增強(qiáng),我國(guó)逐漸重視大中學(xué)生體質(zhì)健康。2014年四月二十四日,教育部體衛(wèi)司司長(zhǎng)王登峰
14、在發(fā)布會(huì)上透露,新版《國(guó)家學(xué)生體質(zhì)健康標(biāo)準(zhǔn)》已經(jīng)基本成形,和舊版相比,取消了所有選測(cè)項(xiàng)目,統(tǒng)一為必測(cè)項(xiàng)目。據(jù)介紹,新版中要求大、中學(xué)生必測(cè)長(zhǎng)跑。測(cè)試成績(jī)分優(yōu)秀、良好、及格和不及格4個(gè)等級(jí),分別記入學(xué)校為每個(gè)學(xué)生制作的《國(guó)家學(xué)生體質(zhì)健康標(biāo)準(zhǔn)登記卡》。教育部表示,學(xué)校沒按規(guī)定執(zhí)行的,將在學(xué)校體育工作等級(jí)評(píng)比中“不合格”。新版標(biāo)準(zhǔn)還要增加體育課學(xué)分。【13】 </p><p> 大學(xué)生的健康成長(zhǎng)關(guān)系到一個(gè)國(guó)家和整個(gè)民
15、族發(fā)展的未來(lái),對(duì)于我國(guó)大學(xué)生而言,其身體與智力的發(fā)展正處于關(guān)鍵時(shí)期。大學(xué)生健康體適能測(cè)試,是高校體育工作中的一個(gè)重要的組成部分,也是學(xué)校教育評(píng)價(jià)體系中所必不可少。統(tǒng)計(jì)分析這種方法從整體上反映和分析事物數(shù)量特征,可以觀察并發(fā)現(xiàn)事物的本質(zhì)和發(fā)展規(guī)律,作出正確的判斷。體測(cè)成績(jī)的統(tǒng)計(jì)分析從微觀上有助于學(xué)生自己更好的了解自己的身體健康狀態(tài),并作出相應(yīng)調(diào)整。研究當(dāng)前大學(xué)生身體素質(zhì)的真實(shí)現(xiàn)狀,該研究成果有著非常重要的應(yīng)用價(jià)值。</p>
16、<p> 朱慧平,張曉芳在[18]中采用文獻(xiàn)資料法、數(shù)理統(tǒng)計(jì)法、問卷調(diào)查等方法,對(duì)甘肅省當(dāng)前大學(xué)生的體質(zhì)健康狀況進(jìn)行了調(diào)查研究。結(jié)果發(fā)現(xiàn):1)男生和女生體質(zhì)健康狀況存在著較大的差距,男生明顯好于女生。2)城市、縣城、村鎮(zhèn)的學(xué)生體質(zhì)健康狀況存在著一定的差異,鄉(xiāng)村學(xué)生好于城市學(xué)生。3)年級(jí)不同,學(xué)生的體質(zhì)狀況也不同,研究結(jié)果表示大二學(xué)生最好,大四學(xué)生最差,從大學(xué)一年級(jí)到四年級(jí)學(xué)生的體質(zhì)健康狀況有先提高后降低的趨勢(shì)。</p&
17、gt;<p> 李愷憲在[17]中探討不同體育生活方式對(duì)大學(xué)生的體質(zhì)狀況有什么影響以及兩者相互關(guān)系, 研究當(dāng)中主要采用文獻(xiàn)資料、問卷調(diào)查、專家訪談等研究方法, 進(jìn)行問卷調(diào)查對(duì)江蘇地區(qū)普通高校大學(xué)生的體育生活方式, 結(jié)果發(fā)現(xiàn): 不同年級(jí)的體育生活方式存在明顯的差異, 前三個(gè)年級(jí)的學(xué)生都有很好的體育生活方式,到大四之后學(xué)生的體育生活方式明顯下降; 在這些學(xué)生中調(diào)查了不同的體育生活方式并進(jìn)行比較分析,結(jié)果表明, 具有良好體育生
18、活方式特征的大學(xué)生體質(zhì)狀況明顯好于另一部分大學(xué)生; 因此, 建立良好的體育生活方式, 可以提高身體機(jī)能素質(zhì), 促進(jìn)柔韌、速度和耐力素質(zhì)的發(fā)展, 最終促進(jìn)大學(xué)生體質(zhì)的全面發(fā)展。</p><p> 吳磊在[19]中通過體育課的體能練習(xí)提高大學(xué)生體質(zhì)測(cè)試的健康水平,結(jié)合體測(cè)的內(nèi)容設(shè)置相關(guān)的體能項(xiàng)目的訓(xùn)練,并有針對(duì)性的進(jìn)行練習(xí)。本文運(yùn)用訪談法、問卷調(diào)查法、統(tǒng)計(jì)法試驗(yàn)法等相關(guān)研究方法對(duì)目前高校存在的問題進(jìn)行分析和總結(jié)提出
19、相關(guān)具體方案,為大學(xué)生身體素質(zhì)的提升打好基礎(chǔ)。</p><p> 本文以2010年中國(guó)農(nóng)業(yè)大學(xué)的在校生體測(cè)數(shù)據(jù)為依據(jù),主要運(yùn)用統(tǒng)計(jì)分析的描述性統(tǒng)計(jì)、方差分析、回歸分析、判別分析,旨在發(fā)現(xiàn)一些規(guī)律和問題。首先從描述性統(tǒng)計(jì)量中算出各個(gè)年級(jí)的體測(cè)成績(jī)的幾個(gè)統(tǒng)計(jì)量。接著用方差分析對(duì)不同學(xué)院學(xué)生的身高分別進(jìn)行了顯著性分析,用多重比較得出哪兩種學(xué)院學(xué)生的身高差異性大。在回歸分析中,先對(duì)數(shù)據(jù)做了相關(guān)性分析,查找相關(guān)性比較強(qiáng)的
20、,所以擬合了身高和體重的一元回歸和身高、體重。肺活量的二元回歸,最后求出回歸方程,畫出了擬合圖。在判別分析中,對(duì)身高體重等級(jí)做了分類。第一類是超重,第二類是肥胖,第三類是較低體重,第四類是營(yíng)養(yǎng)不良,第五類是正常體重,用5999名學(xué)生對(duì)291名學(xué)生進(jìn)行分類。</p><p> 2 常用統(tǒng)計(jì)分析方法</p><p> 2.1 描述性統(tǒng)計(jì)分析</p><p> 2.
21、1.1 常用統(tǒng)計(jì)量</p><p> 通常在得到數(shù)據(jù)并對(duì)數(shù)據(jù)進(jìn)行預(yù)處理后,需要對(duì)數(shù)據(jù)進(jìn)行描述性的統(tǒng)計(jì)分析。常用統(tǒng)計(jì)量有以下幾種:</p><p> (1)樣本均值(mean),描述了樣本數(shù)據(jù)相對(duì)中的中心位置,計(jì)算公式:</p><p> (2)樣本標(biāo)準(zhǔn)差(std),描述了樣本數(shù)據(jù)變異程度的大小,計(jì)算公式:</p><p> (3)樣本
22、極差(range)作為樣本數(shù)據(jù)變異程度大小的一個(gè)簡(jiǎn)單度量,計(jì)算公式:</p><p> (4)最大值和最小值(Max和min)求樣本數(shù)據(jù)中的最大值和最小值。公式是。</p><p> (5)中位數(shù)(Median):顧名思義就是將樣本數(shù)據(jù)從小到大依次排列,位于中間的那個(gè)觀測(cè)值,樣本P分位數(shù)定義如下 </p><p> (6)眾數(shù)(Mode):描述了樣本觀測(cè)值數(shù)據(jù)
23、中出現(xiàn)最多的數(shù)。</p><p> (7)變異系數(shù)是衡量數(shù)據(jù)變異程度的一個(gè)統(tǒng)計(jì)量,和標(biāo)準(zhǔn)差不同,當(dāng)單位和平均值不同時(shí),比較其變異程度就要用變異系數(shù),即標(biāo)準(zhǔn)差和平均數(shù)的比值。</p><p> (8)樣本偏度(skewness)用來(lái)計(jì)算樣本數(shù)據(jù)的偏度,偏度反映了總體分布密度曲線的對(duì)稱性信息,偏度越接近0,說(shuō)明分布越對(duì)稱。如偏度大于0說(shuō)明概率密度的右尾巴長(zhǎng),頂點(diǎn)偏向左邊,偏度小于0說(shuō)明概率
24、密度的左尾巴長(zhǎng),頂點(diǎn)偏向右邊,計(jì)算公式:,其中為樣本k階中心矩。</p><p> (9)樣本k階中心矩(moment):</p><p> (10)樣本的峰度(Kurtosis)反映了總體分布密度曲線在其峰值附近的陡峭程度,計(jì)算公式:</p><p> 2.1.2 常用統(tǒng)計(jì)圖</p><p> 1.直方圖(hist/hist3)&l
25、t;/p><p> 在觀察數(shù)據(jù)所服從的分布時(shí),直方圖是非常簡(jiǎn)潔實(shí)用的。做直方圖的步驟如下:</p><p> (1)將樣本觀測(cè)值從小到大排序得.</p><p> (2)適當(dāng)選取略小于的數(shù)與略大于的數(shù),將區(qū)間隨意分為個(gè)不相交的小區(qū)間,記第個(gè)小區(qū)間為,其長(zhǎng)度為.</p><p> (3)把樣本觀測(cè)值逐個(gè)分到各區(qū)間內(nèi),并計(jì)算樣本觀測(cè)值落在各區(qū)
26、間內(nèi)的頻數(shù)及頻率.</p><p> (4)在軸上截取各區(qū)間,并以各區(qū)間為底,以為高作小矩形,就得到頻數(shù)直方圖,若以為高作小矩形,就得到頻率直方圖。</p><p> MATLAB中繪制頻數(shù)直方圖的函數(shù)是hist和hist3(二元變量的三維直方圖)。</p><p> 2.箱線圖(boxplot)</p><p><b>
27、箱線圖的做法如下:</b></p><p> (1)畫一個(gè)箱子,其左側(cè)線為樣本0.25分位數(shù)位置,其右側(cè)線為樣本0.75分位數(shù)位置,在樣本中位數(shù)(即0.5分位數(shù))位置上畫一條豎線,畫在箱子內(nèi)。這個(gè)箱子包含了樣本中50%的數(shù)據(jù)。</p><p> (2)在箱子左右兩側(cè)各引出一條水平線,左側(cè)線畫至樣本最小值,右側(cè)線畫至樣本最大值,這樣每條線段包含了樣本25%的數(shù)據(jù)。</p
28、><p> 以上兩步得到的圖形就是樣本數(shù)據(jù)的水平箱線圖,當(dāng)然箱線圖也可以作成豎直的形式。從箱線圖上能大概看出樣本數(shù)據(jù)的分布情況。</p><p><b> 2.2 方差分析</b></p><p> 方差分析產(chǎn)生于英國(guó),它是由統(tǒng)計(jì)學(xué)家R.A.Fisher在20世紀(jì)20年代提出的一種統(tǒng)計(jì)方法。方差分析是分析試驗(yàn)(或觀測(cè))數(shù)據(jù)的一種統(tǒng)計(jì)方法。在工
29、農(nóng)業(yè)生產(chǎn)和科學(xué)研究中,經(jīng)常要分析各種因素之間的交互作用對(duì)研究對(duì)象某些指標(biāo)值的影響。在方差分析中,把試驗(yàn)數(shù)據(jù)的總波動(dòng)(總變差或總方差)分解為由所考慮因素引起的波動(dòng)(各因素的變差)和隨機(jī)因素引起的波動(dòng)(誤差的變差),然后通過分析比較這些變差來(lái)推斷哪些因素對(duì)所考察指標(biāo)的影響是顯著的,哪些是不顯著的。也就是分析在諸多因素中哪些因素是主要的,哪些是次要的,以及主要因素處于何種狀態(tài)時(shí),才能使所考察的指標(biāo)達(dá)到一個(gè)較高的水平,這就是方差分析所要解決的問
30、題。</p><p> 本文主要對(duì)數(shù)據(jù)中的13個(gè)學(xué)院學(xué)生的身高進(jìn)行了單因素一元方差分析和非參數(shù)方差分析,其中單因素一元方差分析,樣本數(shù)據(jù)應(yīng)滿足方差分析的幾個(gè)基本假定,即(1)所有樣本均來(lái)自正態(tài)總體(2)這些正態(tài)總體具有相同的方差(3)所有觀測(cè)值相互獨(dú)立,即獨(dú)立抽樣。在前兩個(gè)假定基本滿足的情況下,一般認(rèn)為方差分析檢驗(yàn)(ANOVA test)是穩(wěn)健的。</p><p> (1)單因素方差分
31、析的數(shù)學(xué)模型。設(shè)因素有個(gè)水平,對(duì)應(yīng)試驗(yàn)指標(biāo)的個(gè)總體,記為,它們的分布為</p><p><b> ?。?-1) </b></p><p> 今從這個(gè)總體中各自獨(dú)立地抽取一個(gè)樣本,取自的樣本記為 列表如表2-1所示。</p><p> 表 2-1 單因素方差分析的樣本數(shù)據(jù)</p><p><b> 其中&
32、lt;/b></p><p><b> (2-2)</b></p><p> 單因素方差分析的數(shù)學(xué)模型為</p><p> . (2-3)</p><p> 其中表示獨(dú)立同分布。欲檢驗(yàn)因素對(duì)試驗(yàn)指標(biāo)有無(wú)顯著影響,相當(dāng)于檢驗(yàn)</p><p> 不全相等. (2-4)
33、 </p><p> 原假設(shè)成立表示因素對(duì)試驗(yàn)指標(biāo)無(wú)顯著影響。令</p><p> 則(2-3)式可改寫為</p><p><b> (2-5)</b></p><p><b> (2-4)式等價(jià)于</b></p>&
34、lt;p> 這里的稱為因素的第個(gè)水平所引起的效應(yīng),可以看成對(duì)總平均的“貢獻(xiàn)”大小。若,稱的效應(yīng)為正,若,稱的效應(yīng)為負(fù)。</p><p> (2)單因素方差分析的原理,作(2-4)式的假設(shè)檢驗(yàn),應(yīng)從分析樣本數(shù)據(jù)的差異入手,數(shù)據(jù)的差異可分為系統(tǒng)偏差和隨機(jī)誤差,來(lái)自不同總體樣本數(shù)據(jù)之間的差異稱為系統(tǒng)偏差,來(lái)自同一總體樣本數(shù)據(jù)之間的差異稱為隨機(jī)誤差。樣本數(shù)據(jù)之間的差異通常用離差平方和(樣本觀測(cè)數(shù)據(jù)與總均值的差的
35、平方和)來(lái)表示,方差分析就是將樣本數(shù)據(jù)的總的離差平方和分解為兩部分,一部分為因素所造成的離差平方和,即系統(tǒng)偏差,又稱為組間離差平方和;另一部分為隨機(jī)因素所造成的離差平方和,即隨機(jī)誤差,又稱為組內(nèi)離差平方和。然后根據(jù)兩部分平方和構(gòu)造檢驗(yàn)統(tǒng)計(jì)量,推導(dǎo)統(tǒng)計(jì)量所服從的分布,最后寫出拒絕域。直觀上可以這樣理解:若總離差平方和中主要是組間離差平方和,組內(nèi)離差平方和所占比重非常小,則可認(rèn)為各組數(shù)據(jù)之間的差異是顯著的,即因素對(duì)試驗(yàn)指標(biāo)的影響是顯著的;若
36、總離差平方和中主要是組內(nèi)離差平方和,組間離差平方和所占比重非常小,則可認(rèn)為因素對(duì)試驗(yàn)指標(biāo)的影響是不顯著的。</p><p> (3)離差平方和及自由度的分解,從模型(2-5)式可以看出</p><p> ?。?-6) 上式左邊表示每一個(gè)樣本觀測(cè)數(shù)據(jù)與總均值的偏差,這個(gè)偏差被分成兩部分,其中表示由因素的不同水平所引起的系統(tǒng)偏差,表示隨機(jī)誤差。令</p><p>
37、用作為的估計(jì),作為的估計(jì),作為的估計(jì),則(2-6)式為</p><p> 記表示總離差平方和,則</p><p><b> 令</b></p><p> 可以看出,為因素所造成的離差平方和,稱為組間離差平方和,為隨機(jī)因素所造成的離差平方和,稱為組內(nèi)離差平方和。這樣就有如下平方和分解式</p><p> 為了構(gòu)造檢
38、驗(yàn)統(tǒng)計(jì)量并推導(dǎo)其分布,引入如下定理。</p><p> 在以上記號(hào)下,對(duì)于模型(2-5)式,有以下結(jié)論成立。</p><p><b> · ;</b></p><p> · 原假設(shè)成立時(shí),,與相互獨(dú)立。</p><p> 對(duì)于(2-4)式的假設(shè)檢驗(yàn),構(gòu)造檢驗(yàn)統(tǒng)計(jì)量</p>&l
39、t;p> 其中稱為組間均方離差平方和,稱為組內(nèi)均方離差平方和。由定理可知,當(dāng)原假設(shè)成立時(shí),</p><p> 直觀上可以看出,當(dāng)統(tǒng)計(jì)量的觀測(cè)值大于某個(gè)臨界值時(shí),應(yīng)拒絕原假設(shè),所以對(duì)于給定的顯著性水平,拒絕域?yàn)?lt;/p><p> 其中為分布的上側(cè)分位數(shù)。</p><p> (4)單因素方差分析表</p><p> 根據(jù)以上過程列
40、出單因素方差分析表,如表2-2所示。</p><p> 表 2-2 單因素方差分析表</p><p> 方差分析表很直觀地展現(xiàn)了方差分析的過程,通過對(duì)比值與臨界值的大小,作出最后的結(jié)論。也可以將表格最后一列的臨界值換成檢驗(yàn)的值,其中。對(duì)于給定的顯著性水平,當(dāng)時(shí),應(yīng)拒絕原假設(shè),即認(rèn)為因素對(duì)試驗(yàn)指標(biāo)有顯著影響,并且值越小,顯著性越強(qiáng);當(dāng)時(shí),應(yīng)接受原假設(shè),即認(rèn)為因素對(duì)試驗(yàn)指標(biāo)無(wú)顯著影響。&
41、lt;/p><p> 非參數(shù)方差分析不要求樣本來(lái)自于正態(tài)總體,也不要求正態(tài)總體具有相同的方差,即不要求正態(tài)性和方差性假定。當(dāng)樣本不滿足這正態(tài)性和方差性的假定時(shí),就要采取基于秩的非參數(shù)檢驗(yàn),本文中主要用Kruskal-Walls檢驗(yàn)。MATLAB工具箱中提供了kruskalwalls函數(shù),用來(lái)做單因素非參數(shù)方差分析。檢驗(yàn)的原假設(shè)是:k個(gè)獨(dú)立樣本來(lái)自于相同的總體。當(dāng)原假設(shè)成立時(shí),并且樣本容量足夠大時(shí),檢驗(yàn)統(tǒng)計(jì)量H近似服
42、從自由度為k-1的分布,即</p><p><b> ?。?-7)</b></p><p> 其中,k為樣本數(shù),為第j個(gè)樣本的樣本容量,,為第j個(gè)樣本的秩和。對(duì)于給定的顯著性水平,當(dāng)H的觀測(cè)值大于或等于,拒絕原假設(shè),表示k個(gè)獨(dú)立樣本來(lái)自于不同的總體,或者說(shuō)k個(gè)樣本有顯著性差異。【16】</p><p><b> 2.3 回歸分析&
43、lt;/b></p><p> 在客觀世界中變量之間的關(guān)系普遍存在。變量之間的關(guān)系一般說(shuō)可以分為非確定性和確定性這兩種。非確定性關(guān)系即所謂相關(guān)關(guān)系。例如人的身高和體重之間存在著關(guān)系,一般來(lái)說(shuō)越高體重越重,有時(shí)同樣身高的人,體重也是不一樣的,之所以有這種關(guān)系,是因?yàn)槲覀兩婕暗淖兞渴请S機(jī)變量。確定性關(guān)系是指變量之間的關(guān)系可以用函數(shù)表達(dá)?;貧w分析研究的是相關(guān)關(guān)系的一種數(shù)學(xué)工具,這種工具能從一個(gè)變量取得值去估計(jì)另
44、一個(gè)變量所取的值。用來(lái)認(rèn)識(shí)事物的內(nèi)在規(guī)律和本質(zhì)屬性?!?6】</p><p><b> ?。?)一元回歸模型</b></p><p> 設(shè)有兩個(gè)變量和,其中是可以精確測(cè)量或控制的非隨機(jī)變量,是隨機(jī)變量,假定隨機(jī)變量與可控變量之間存在線性相關(guān)關(guān)系,建立與的數(shù)學(xué)模型如下:</p><p><b> (2-8)</b><
45、;/p><p> 其中未知參數(shù)和都不依賴于。稱(2.8)式為關(guān)于的一元線性回歸模型,其中稱為回歸系數(shù)。由一元線性回歸模型可知,當(dāng)固定時(shí),,令,它是固定時(shí)隨機(jī)變量的數(shù)學(xué)期望。直線近似表示了與的線性相關(guān)關(guān)系,稱為關(guān)于的回歸函數(shù),稱為關(guān)于的理論回歸方程。</p><p> ?。?) 參數(shù)的最小二乘估計(jì)</p><p> 對(duì)作次獨(dú)立的觀測(cè),得到觀測(cè)數(shù)據(jù).根據(jù)(2-8)式可得
46、</p><p> 其中表示獨(dú)立同分布。令</p><p> 二元函數(shù)的最小值點(diǎn)稱為的最小二乘估計(jì),通過解下面方程組求得</p><p><b> (2-9)</b></p><p><b> 其中</b></p><p> 當(dāng)方程組(2-9)的系數(shù)矩陣的行列式&l
47、t;/p><p><b> 可以解得</b></p><p><b> (2-10)</b></p><p><b> 其中</b></p><p> 將代入理論回歸方程可得,稱之為關(guān)于的經(jīng)驗(yàn)回歸方程。由于</p><p> 可知關(guān)于的經(jīng)驗(yàn)回歸直線
48、一定過點(diǎn). 可以證明估計(jì)量服從以下分布:</p><p> ?。?-11) </p><p> 從而可知分別是的無(wú)偏估計(jì)。</p><p> ?。?) 回歸方程的顯著性檢驗(yàn)</p><p> 對(duì)于變量和的任意對(duì)觀測(cè)值,只要不全相等,則無(wú)論變量和之間是否存在線性相關(guān)關(guān)系,都可根據(jù)上面介紹的方法求得一個(gè)線性回
49、歸方程. 顯然,只有當(dāng)變量和之間存在線性相關(guān)關(guān)系時(shí),這樣的線性回歸方程才是有意義的。為了使求得的線性回歸方程真正有意義,就需要檢驗(yàn)變量和之間是否存在顯著的線性相關(guān)關(guān)系。若和之間存在顯著的線性相關(guān)關(guān)系,則回歸模型(2-8)式中的不應(yīng)為0,因?yàn)槿?,則就不依賴于了。因此需要檢驗(yàn)假設(shè)</p><p><b> (2-12)</b></p><p><b> 檢驗(yàn)
50、</b></p><p> 圖 2-1離差分解示意圖</p><p> 如圖2-1所示,每個(gè)觀測(cè)點(diǎn)處的與均值的離差被分解為兩部分,即</p><p> 于是總離差平方和可作如下分解</p><p><b> 可以證明. 令</b></p><p><b> 則有&
51、lt;/b></p><p><b> ?。?-13)</b></p><p> 這里的為總離差平方和,它被分解為兩部分。其中是估計(jì)值的離差平方和,反映了的總變差中由于與之間的線性關(guān)系所引起的的變差,稱為回歸平方和。就是前文中的,稱為殘差平方和(或剩余平方和),它反映了的總變差中不能由回歸直線來(lái)解釋的變差。由圖2-6可以看出,若總離差平方和中主要是回歸平方和,
52、殘差平方和所占比重非常小,則說(shuō)明觀測(cè)數(shù)據(jù)的散點(diǎn)基本集中在回歸直線附近,進(jìn)一步說(shuō)明和之間存在顯著的線性相關(guān)關(guān)系,因此可以根據(jù)和構(gòu)造檢驗(yàn)統(tǒng)計(jì)量,檢驗(yàn)和之間的線性相關(guān)關(guān)系是否顯著。</p><p> (4)多重線性回歸分析原理</p><p> 設(shè)隨機(jī)變量與個(gè)可控變量之間存在線性相關(guān)關(guān)系,建立與的數(shù)學(xué)模型如下:</p><p><b> (2-14)<
53、;/b></p><p> 其中未知參數(shù)和都不依賴于. 稱(2-14)式為關(guān)于的重線性回歸模型,其中稱為回歸系數(shù)。類似于一元線性回歸,稱為關(guān)于的理論回歸方程。</p><p><b> 2.4 判別分析</b></p><p> 判別分析是對(duì)樣本進(jìn)行分類,但是和聚類分析不一樣,判別分析的研究對(duì)象是已經(jīng)有了分類,,根據(jù)抽取的樣本建立
54、判別公式和判別標(biāo)準(zhǔn),然后用這些公式和標(biāo)準(zhǔn)判別未知的類別的樣本的類別。</p><p> 本文主要用距離判別,其中距離判別的基本思想是首先根據(jù)已知分類的數(shù)據(jù),分別計(jì)算各類的重心,即分組均值,判別標(biāo)準(zhǔn):對(duì)于任給一次觀測(cè)值,若她與i類的重心距離最近,就認(rèn)為她來(lái)自第i類。馬氏距離原理設(shè)G是維總體,它的分布的均值向量和協(xié)方差矩陣分別為</p><p><b> ?。?-15)</b
55、></p><p> 設(shè)為取自總體G的兩個(gè)樣品,假定(為正定矩陣),定義x,y間的平方馬氏距離為</p><p> 定義x到總體G的平方馬氏距離為</p><p><b> (2-16)</b></p><p> 兩個(gè)總體的判別,設(shè)有兩個(gè)p維總體,分布的均值分別為,協(xié)方差矩陣分別為。從兩總體中分別抽取容量為
56、的樣本,記為?,F(xiàn)有一未知類別的樣品,記為x,試試判別x的歸屬,現(xiàn)有以下判別規(guī)則</p><p> 當(dāng)時(shí),判定;否則判定。若相等則待判。這是通常為馬氏距離。在采用馬氏距離的情況下,下面分情況進(jìn)行討論。</p><p><b> ?。?)已知時(shí)</b></p><p><b> 將兩個(gè)距離相減可得</b></p>
57、;<p><b> ?。?-17)</b></p><p><b> 令</b></p><p><b> (2-18)</b></p><p> 則判別規(guī)則還可表示為</p><p><b> ?。?-19)</b></p>
58、;<p> 稱W(x)為兩組距離判別的線性判別函數(shù),a為判別系數(shù)。</p><p><b> ?。?)已知時(shí)</b></p><p><b> 令</b></p><p><b> ?。?-20)</b></p><p> 則為二次判別函數(shù),判別規(guī)則為<
59、;/p><p><b> (2-21) </b></p><p><b> ?。?)未知時(shí)</b></p><p> 在實(shí)際問題中,這種情況最為常見,此時(shí)有樣本對(duì)進(jìn)行估計(jì)</p><p> 于是可得平方馬氏距離的估計(jì)和二次判別函數(shù)的估計(jì)</p><p><b>
60、?。?-22)</b></p><p> 將格式(2-21)中的換位,即可得此種情況的判別規(guī)則。</p><p> 3 MATLAB主要統(tǒng)計(jì)函數(shù)簡(jiǎn)介</p><p> MATLAB意為矩陣工廠(Matrix&Laboratory兩個(gè)詞的組合,)。MATLAB是由美國(guó)The Mathworks公司發(fā)布的。MATLAB的基本數(shù)據(jù)單位是矩陣,它的
61、指令表達(dá)式與數(shù)學(xué)、工程中常用的形式十分相似,故用MATLAB來(lái)解算問題要比用C,F(xiàn)ORTRAN等語(yǔ)言完成相同的事情簡(jiǎn)捷得多,并且MATLAB也吸收了像Maple等軟件的優(yōu)點(diǎn),使MATLAB成為一個(gè)強(qiáng)大的數(shù)學(xué)軟件。在新的版本中也加入了對(duì)C,F(xiàn)ORTRAN,C++,JAVA的支持。可以直接調(diào)用,用戶也可以將自己編寫的實(shí)用程序?qū)氲組ATLAB函數(shù)庫(kù)中方便自己以后調(diào)用。數(shù)據(jù)分析的目的是利用數(shù)據(jù)來(lái)研究一個(gè)領(lǐng)域的具體問題。數(shù)據(jù)分析的過程包括確定數(shù)
62、據(jù)分析的目標(biāo)、研究設(shè)計(jì)、收集數(shù)據(jù)、分析數(shù)據(jù)、解釋結(jié)果。從數(shù)據(jù)分析的整個(gè)過程來(lái)看,軟件的使用主要是在數(shù)據(jù)整理與分析階段。軟件所起的主要作用是整理、計(jì)算、繪制圖表等。MATLAB 在統(tǒng)計(jì)分析方面的知識(shí),有很多軟件都可以用作統(tǒng)計(jì)分析與計(jì)算,比如SAS、Spss、Splus等軟件。在這些軟件中,MATLAB的功能無(wú)疑是最強(qiáng)大的。MATLAB有簡(jiǎn)便的編程語(yǔ)言,還有包羅萬(wàn)象的工具箱,易學(xué)易用,學(xué)</p><p> 本文主要
63、用了描述性統(tǒng)計(jì)、方差分析、回顧分析、判別分析對(duì)2010中國(guó)農(nóng)大的體測(cè)成績(jī)進(jìn)行分析。主要涉及的函數(shù)有:</p><p> ?。?)num = xlsread(filename, range)</p><p> 從指定文件名夾讀取,輸入?yún)?shù)filename是由單引號(hào)括起來(lái)的字符串。輸入?yún)?shù)range是所在的單元格范圍,比如說(shuō)range='A1:A8'。比如說(shuō)num=xlsre
64、ad('2010.xls'),即從當(dāng)前程序所在文件夾里,從A1單元格開始讀取,讀取2010.xls文件,把數(shù)據(jù)返回給num。</p><p> (2)[p,table,stats] = anova1(X,group),anova1函數(shù)是單因素一元方差分析。原假設(shè)是輸入?yún)?shù)X的各列所對(duì)應(yīng)的總體具有相同的均值。矩陣X的列數(shù)表示因素的水平數(shù),矩陣X的行數(shù)表示樣本容量。輸入的參數(shù)group可以是字符串元
65、胞數(shù)組或是字符數(shù)組,用來(lái)指明每組的組名,在本文是學(xué)院名稱。輸出參數(shù)p是檢驗(yàn)的p值,對(duì)于給定的顯著性水平,如果,則拒絕原假設(shè)。認(rèn)為X的各列所對(duì)應(yīng)的總體具有不完全相同的均值。反之,則接受原假設(shè)。輸出參數(shù)table是元胞數(shù)組形式的方差分析表。方差分析表有六列,第一列為方差來(lái)源,方差來(lái)源有組間(Columns)、組內(nèi)(Error)和總計(jì)(Totel)第二列為各方差來(lái)源所對(duì)應(yīng)的的平方和(SS)。第三列為個(gè)方差所對(duì)應(yīng)的自由度(df)。第四列為各方差
66、來(lái)源所對(duì)應(yīng)的均方(MS),MS=SS/df。第五列為F檢驗(yàn)統(tǒng)計(jì)量的觀測(cè)值,它是組間均方和組內(nèi)均方的比值。第六列為檢驗(yàn)p值,是根據(jù)F檢驗(yàn)統(tǒng)計(jì)量的分布得出的。輸出的stats是結(jié)構(gòu)體變量,用于進(jìn)行后續(xù)的多重比較。還會(huì)返回箱線圖。</p><p> [p,table,stats] =kruskalwallis(X,group),kruskalwallis函數(shù)是非參數(shù)方差分析。輸出參數(shù)和上面的anova1函數(shù)返回的一樣
67、,輸入?yún)?shù)也一樣。</p><p> (3)R=corrcoef(data),進(jìn)行相關(guān)性分析,求相關(guān)系數(shù)。輸入?yún)?shù)data是矩陣,得到的結(jié)果是一個(gè)n*n矩陣相關(guān)系數(shù)矩陣。</p><p> ?。?)mdl=LinearModel.fit(x,y),LinearModel.fit函數(shù)是做一元線性回歸。輸入?yún)?shù)x是自變量觀測(cè)矩陣,輸入y是因變量觀測(cè)矩陣,x和y具有相同的行。輸出線性回歸模型的
68、參數(shù)。</p><p> ?。?)class=classify(sample,training,group),其中輸入?yún)?shù)sample是全部樣本數(shù)據(jù),即6290個(gè)學(xué)生的身高,體重,肺活量數(shù)據(jù)。輸入?yún)?shù)training是已知組別的樣本數(shù)據(jù),即5999名學(xué)生的身高,體重,肺活量數(shù)據(jù)。輸入?yún)?shù)group是樣本的分組信息數(shù)據(jù),其中第一類是超重,第二類是肥胖,第三類是較低體重,第四類是營(yíng)養(yǎng)不良,第五類是正常體重,用前599
69、9名學(xué)生判別291個(gè)同學(xué)的類別。</p><p> 4 某高校在校生體測(cè)成績(jī)統(tǒng)計(jì)分析</p><p><b> 4.1數(shù)據(jù)來(lái)源</b></p><p> 本文數(shù)據(jù)取自2010年體測(cè)成績(jī)(中國(guó)農(nóng)大)共有學(xué)生6290個(gè)學(xué)生,三個(gè)年級(jí),測(cè)試成績(jī)有身高,體重,身高體重等級(jí),肺活量,肺活量體重指數(shù),肺活量體重分?jǐn)?shù),耐力類項(xiàng)目成績(jī),耐力類項(xiàng)目分?jǐn)?shù),耐
70、力類項(xiàng)目等級(jí),柔韌、力量項(xiàng)目成績(jī),柔韌、力量項(xiàng)目分?jǐn)?shù)、柔韌、力量項(xiàng)目等級(jí),速度、靈巧類項(xiàng)目成績(jī),速度、靈巧類項(xiàng)目分?jǐn)?shù),速度、靈巧類項(xiàng)目等級(jí),測(cè)試總分,總分等級(jí)。數(shù)據(jù)來(lái)源于中國(guó)農(nóng)業(yè)大學(xué)體質(zhì)健康測(cè)試中心:http://tice.cau.edu.cn/tyb_clt/news/user/title.action?typeid=27,部分?jǐn)?shù)數(shù)據(jù)件附錄。</p><p><b> 4.2描述性統(tǒng)計(jì)量</b
71、></p><p> 樣本數(shù)據(jù)是中國(guó)農(nóng)業(yè)大學(xué)2010年的體測(cè)數(shù)據(jù),在初步接觸樣本數(shù)據(jù)中國(guó)農(nóng)業(yè)大學(xué)2010年的體測(cè)數(shù)據(jù)之前,有必要先從幾個(gè)特征數(shù)認(rèn)識(shí)一下它們,也就是先用MATLAB軟件計(jì)算出樣本的幾個(gè)描述性統(tǒng)計(jì)量。包括均值(mean)標(biāo)注差(std)最大值(max)最小值(min)極差(range)中位數(shù)(median)眾數(shù)(mode)變異系數(shù)(cvar)偏度(skewness)峰度(krtosis)。通過
72、以下表格形式給出,相關(guān)程序放在附件中。</p><p> 09級(jí)學(xué)生各個(gè)測(cè)試成績(jī)數(shù)據(jù)的描述性統(tǒng)計(jì)量如表4-1。</p><p> 08級(jí)學(xué)生各個(gè)測(cè)試成績(jī)數(shù)據(jù)的描述性統(tǒng)計(jì)量如表4-2。</p><p> 07級(jí)學(xué)生各個(gè)測(cè)試成績(jī)數(shù)據(jù)的描述性統(tǒng)計(jì)量如表4-3。</p><p> 表 4-1 09級(jí)學(xué)生各個(gè)測(cè)試成績(jī)數(shù)據(jù)的描述性統(tǒng)</p&
73、gt;<p> 表4-2 08級(jí)各個(gè)測(cè)試成績(jī)數(shù)據(jù)的描述性統(tǒng)計(jì)量</p><p> 表 4-3 07級(jí)各個(gè)測(cè)試成績(jī)的描述性統(tǒng)計(jì)量</p><p><b> 4.3 方差分析</b></p><p> 本節(jié)主要研究13個(gè)學(xué)院學(xué)生的身高有無(wú)顯著性差異,在進(jìn)行了單因素一元方差分析,先進(jìn)行正態(tài)性檢驗(yàn)和方差齊性檢驗(yàn),樣本數(shù)據(jù)不符合這
74、兩個(gè)檢驗(yàn),那就進(jìn)行非參數(shù)方差分析。</p><p> 4.3.1 正態(tài)性檢驗(yàn)</p><p> 調(diào)用lillietest函數(shù)分別對(duì)13個(gè)學(xué)院學(xué)生身高進(jìn)行正態(tài)性檢驗(yàn),相應(yīng)程序如下:</p><p> >> [x,y]=xlsread('2010.xls');%讀取文件</p><p> >> sg
75、=x(:,3);</p><p> % 提取矩陣x的第3列數(shù)據(jù),即全部學(xué)生的身高</p><p> >> college=y(2:end,1);% 提取元胞數(shù)組y的第1列的第2行至最后一行數(shù)據(jù),即全部學(xué)生所在學(xué)院的名稱數(shù)據(jù)</p><p> >> college_id = x(:,1);% 提取矩陣x的第1列數(shù)據(jù),即全部同學(xué)所在學(xué)院的編
76、號(hào)數(shù)據(jù)</p><p> >>%*******************正態(tài)性檢驗(yàn)**************************</p><p> % 調(diào)用lillietest函數(shù)分別對(duì)13個(gè)學(xué)院學(xué)生的身高進(jìn)行正態(tài)性檢驗(yàn)</p><p> >> for i=1:13</p><p> sgi=sg(coll
77、ege_id==i);% 提取第i個(gè)學(xué)院的身高數(shù)據(jù)</p><p> [h,p]=lillietest(sgi);% 正態(tài)性檢驗(yàn)</p><p> result(i,:)=p% 把檢驗(yàn)的p值賦給result變量</p><p><b> end</b></p><p><b> result =<
78、/b></p><p><b> 0.1538</b></p><p><b> 0.0010</b></p><p><b> 0.1627</b></p><p><b> 0.0010</b></p><p>&
79、lt;b> 0.0201</b></p><p><b> 0.0206</b></p><p><b> 0.0010</b></p><p><b> 0.0382</b></p><p><b> 0.0010</b>&l
80、t;/p><p><b> 0.0335</b></p><p><b> 0.0037</b></p><p><b> 0.3248</b></p><p><b> 0.0792</b></p><p> 運(yùn)行以上程序得
81、出檢驗(yàn)的p值,可知?jiǎng)涌茖W(xué)院、工學(xué)院的p值大于0.05,在顯著性水平0.05下可認(rèn)為這兩個(gè)學(xué)院的學(xué)生身高服從正態(tài)分布。</p><p> 4.3.2 方差齊性檢驗(yàn)</p><p> 調(diào)用vartestn函數(shù)分別對(duì)13個(gè)學(xué)院學(xué)生身高進(jìn)行方差齊性性檢驗(yàn),相應(yīng)程序如下:</p><p> >>%******************方差齊性檢驗(yàn)*******
82、*****************</p><p> % 調(diào)用vartestn函數(shù)進(jìn)行方差齊性檢驗(yàn)</p><p> >> [p,stats]=vartestn(sg,college)</p><p><b> p =</b></p><p> 9.4377e-013</p><p
83、> 從上面結(jié)果可以看出,檢驗(yàn)的p值p= 9.4377e-013<0.05,說(shuō)明在顯著性水平0.05下拒絕原假設(shè),即不滿足方差分析的基本假設(shè)。Vartestn函數(shù)還生成了兩個(gè)圖形:分組匯總表(Group Summary Table)和箱線圖。箱線圖如圖4-1所示。</p><p><b> stats = </b></p><p> chisqstat
84、: 83.3505</p><p><b> df: 12</b></p><p> Group Summary Table</p><p> Group Count Mean Std Dev</p><p> 動(dòng)科學(xué)院
85、 331 167.926 8.8484</p><p> 動(dòng)醫(yī)學(xué)院 304 166.7526 8.2034</p><p> 工學(xué)院 805 169.4667
86、7.3946</p><p> 經(jīng)濟(jì)管理學(xué)院 723 166.8833 7.0331</p><p> 理學(xué)院 451 168.571 8.5757</p><p> 農(nóng)學(xué)與生物技術(shù)學(xué)院 102
87、5 166.854 7.9307</p><p> 人文與發(fā)展學(xué)院 347 165.5951 7.1121</p><p> 生物學(xué)院 368 168.5467 8.3122</p>&l
88、t;p> 食品科學(xué)與營(yíng)養(yǎng)工程學(xué)院 462 166.2325 6.8377</p><p> 水利與土木工程學(xué)院 582 169.1703 6.8839</p><p> 信息與電氣工程學(xué)院 753 169.6278 7
89、.2492</p><p> 資源與環(huán)境學(xué)院 121 167.405 8.394</p><p> 教務(wù)處 18 169.9556 8.2329</p><p> Pooled
90、 6290 167.9161 7.62</p><p> Bartlett's statistic 83.3505</p><p> Degrees of freedom 12</p><p> p-value 9.4377e-013</p&g
91、t;<p> 分組匯總表包含了分組的一些信息,有組名(即學(xué)院名稱)Group,各組所包含的樣本容量Count,各學(xué)院的身高平均值Mean, 各學(xué)院的身高標(biāo)準(zhǔn)差Std Dev。Pooled所在的行表示樣本的聯(lián)合信息,包括總?cè)藬?shù),總平均值和樣本聯(lián)合標(biāo)準(zhǔn)差。分組匯總表的最后一部分是方差齊性檢驗(yàn)的相關(guān)信息,包括Bartlett檢驗(yàn)統(tǒng)計(jì)量的觀測(cè)值、自由度和檢驗(yàn)的p值。</p><p> 4.3.3 非參數(shù)
92、方差分析</p><p> 單因素一元方差分析要求各組樣本均來(lái)自于正態(tài)總體,并且各正態(tài)總體需要具有相同的方差,在樣本數(shù)據(jù)不滿足這些條件的情況下,還可對(duì)身高進(jìn)行非參數(shù)方差分析。下面調(diào)用kruskalwallis函數(shù)對(duì)身高進(jìn)行非參數(shù)方差分析,代碼如下,相應(yīng)的方差分析表如表4-4所列 </p><p> [data,str] = xlsread('2010.xls
93、');sg = data(:,1);group = str(2:end,1);[p,table,stats]=kruskalwallis(sg,group) </p><p> 表 4-4 非參數(shù)方差分析表</p><p> 圖 4-1 13個(gè)學(xué)院的學(xué)生身高的箱線圖</p><p> 從結(jié)果看出,krusk
94、alwallis函數(shù)返回的p值小于0.05,說(shuō)明在顯著性水平0.05下,拒絕原假設(shè),認(rèn)為不同學(xué)院的學(xué)生身高有顯著性差異。</p><p> 4.3.4 多重比較</p><p> 由于kruskalwallis非參數(shù)檢驗(yàn)13個(gè)學(xué)院學(xué)生的身高有顯著性差異,下面通過多重比較來(lái)檢驗(yàn)在哪兩種學(xué)院學(xué)生的身高的差異是顯著的,調(diào)用multcompare函數(shù)對(duì)不同學(xué)院的學(xué)生身高進(jìn)行多重比較,代碼如下:
95、</p><p> >> % 調(diào)用multcompare對(duì)不同不同學(xué)院的學(xué)生身高進(jìn)行多重比較</p><p> >> [c,m,h,gnames] = multcompare(stats);</p><p> >> c; % 查看多重比較的結(jié)果矩陣c</p><p> >> [gname
96、s,num2cell(m)] % 把m矩陣轉(zhuǎn)為元胞數(shù)組,與gnames放在一起顯示</p><p><b> ans = </b></p><p> '動(dòng)科學(xué)院' [3.1246e+03] [ 99.8107]</p><p> '動(dòng)醫(yī)學(xué)院'
97、 [2.8153e+03] [104.1488]</p><p> '工學(xué)院' [3.5271e+03] [ 64.0019]</p><p> '經(jīng)濟(jì)管理學(xué)院' [2.8797e+03] [ 67.5339]</p><p> '理學(xué)院'
98、; [3.2788e+03] [ 85.5072]</p><p> '農(nóng)學(xué)與生物技術(shù)學(xué)院' [2.9029e+03] [ 56.7191]</p><p> '人文與發(fā)展學(xué)院' [2.5881e+03] [ 97.4824]</p><p>
99、39;生物學(xué)院' [3.2824e+03] [ 94.6601]</p><p> '食品科學(xué)與營(yíng)養(yǎng)工程學(xué)院' [2.7311e+03] [ 84.4831]</p><p> '水利與土木工程學(xué)院' [3.4725e+03] [ 75.2713]</p><p>
100、; '信息與電氣工程學(xué)院' [3.5882e+03] [ 66.1749]</p><p> '資源與環(huán)境學(xué)院' [3.0212e+03] [165.0814]</p><p> '教務(wù)處' [3.5164e+03] [428.0107]</p>
101、<p> 運(yùn)行以上程序,得出動(dòng)科學(xué)院和人文與發(fā)展學(xué)院、工學(xué)院、信息與電氣工程學(xué)院學(xué)生的身高差異顯著。動(dòng)醫(yī)學(xué)院和工學(xué)院、信息與電氣工程學(xué)院學(xué)生的身高差異顯著。工學(xué)院和動(dòng)科學(xué)院、動(dòng)醫(yī)學(xué)院、經(jīng)濟(jì)管理學(xué)院、農(nóng)學(xué)與生物技術(shù)學(xué)院、人文與發(fā)展學(xué)院、食品科學(xué)與營(yíng)養(yǎng)工程學(xué)院學(xué)生的身高差異顯著。經(jīng)濟(jì)管理學(xué)院和工學(xué)院、水利和土木工程學(xué)院、信息與電氣工程學(xué)院學(xué)生的身高差異顯著。理學(xué)院和人文與發(fā)展學(xué)院、食品科學(xué)與營(yíng)養(yǎng)工程學(xué)院學(xué)生的身高差異顯著。農(nóng)
102、學(xué)與生物技術(shù)學(xué)院和工學(xué)院、水利和土木工程學(xué)院、息與電氣工程學(xué)院學(xué)生的身高差異顯著。人文與發(fā)展學(xué)院和動(dòng)科學(xué)院、工學(xué)院、理學(xué)院、生物學(xué)院、土木工程學(xué)院、息與電氣工程學(xué)院學(xué)生的身高差異顯著。生物學(xué)院和人文與發(fā)展學(xué)院、食品科學(xué)與營(yíng)養(yǎng)工程學(xué)院學(xué)生的身高差異顯著。食品科學(xué)與營(yíng)養(yǎng)工程學(xué)院和工學(xué)院、水利和土木工程學(xué)院、信息與電氣工程學(xué)院學(xué)生的身高差異顯著。水利和土木工程學(xué)院和動(dòng)醫(yī)學(xué)院、人文與發(fā)展學(xué)院、食品科學(xué)與營(yíng)養(yǎng)工程學(xué)院學(xué)生的身高差異顯著。信息與電氣
103、工程學(xué)院和動(dòng)科學(xué)院、動(dòng)醫(yī)學(xué)院、經(jīng)濟(jì)管理學(xué)院、農(nóng)學(xué)與生物技術(shù)學(xué)院、人文與發(fā)展學(xué)院、食品科學(xué)與營(yíng)養(yǎng)工程學(xué)院學(xué)生的身高差異顯著。</p><p><b> 4.4 回歸分析</b></p><p> 本節(jié)先對(duì)各個(gè)數(shù)據(jù)進(jìn)行相關(guān)性分析,觀察各數(shù)據(jù)的相關(guān)性,在進(jìn)行回歸分析時(shí),主要對(duì)身高和體重的一元回歸,身高、體重和肺活量的二元回歸。其中sg代表身高,tz代表體重,sgtzfs
104、代表身高體重分?jǐn)?shù),fhl代表肺活量,fhltzfs代表肺活量體重分?jǐn)?shù),nl代表耐力,nlfs代表耐力分?jǐn)?shù),rrll代表柔韌力量,rrllfs代表柔韌力量分?jǐn)?shù),sdlq代表速度靈巧,sdlqfs代表速度靈巧分?jǐn)?shù),zf代表總分。</p><p> 4.4.1 相關(guān)性分析</p><p> 調(diào)用corrcoef函數(shù)對(duì)樣本數(shù)據(jù)進(jìn)行相關(guān)分析,得到的相關(guān)性系數(shù)矩陣如表4-5所列(見附錄)。調(diào)用Ma
105、trixplot函數(shù)對(duì)相關(guān)矩陣作圖,得到的相關(guān)系數(shù)矩陣圖如圖4-2所示,相應(yīng)的MATLAB代碼如下: </p><p> >> data=xlsread('2010.xls');%讀取數(shù)據(jù)</p><p> >> data(:,[1 2 6 10 13 16 19 ])=[];%選取數(shù)據(jù)</p><p> >>
106、; R=corrcoef(data);%進(jìn)行相關(guān)性分析</p><p> >>XVarNames={'sg','tz','sgtifs','fhl','fhltzzs','fhltzfs','nl','nlfs','rrll','rrllfs'
107、;,'sdlq','sdlqfs','zf'};</p><p> >>matrixplot(R,'FigShap','e','FigSize','Auto','ColorBar','on','XVarNames',XVarNames,
108、9;YVarNames',XVarNames);%畫圖</p><p> 圖 4-4 各數(shù)據(jù)相關(guān)系數(shù)矩陣圖</p><p> 4.4.2 身高和體重的一元線性回歸</p><p> 調(diào)用LinearModel.fit函數(shù)對(duì)身高體重做一元回歸分析,擬合效果圖如圖4-3所示,相關(guān)代碼如下:</p><p> >> da
109、ta=xlsread('2010.xls');</p><p> >> y=data(:,4);</p><p> >> x=data(:,3);</p><p> >> mdl=LinearModel.fit(x,y)</p><p><b> mdl = </b&
110、gt;</p><p> Linear regression model:</p><p> y ~ 1 + x1</p><p> Estimated Coefficients:</p><p> Estimate SE tStat pValue</p><p> ____
111、____ ________ _______ ______</p><p> (Intercept) -100.28 2.1539 -46.555 0 </p><p> x1 0.94677 0.012814 73.888 0 </p>&l
112、t;p> Number of observations: 6290, Error degrees of freedom: 6288</p><p> Root Mean Squared Error: 7.85</p><p> R-squared: 0.465, Adjusted R-Squared 0.465</p><p> F-statisti
113、c vs. constant model: 5.46e+03, p-value = 0</p><p> >> yhat=0.94677*x-100.28;>> plot(x, y, 'k.', 'Markersize', 15)%散點(diǎn)圖>> hold on&
114、gt;> plot(x, yhat, 'linewidth', 3)%回歸直線>> xlabel('身高(x)')>> ylabel('體重(y)') </p><p> 圖 4-3 身高體重?cái)M合圖</p><p> 運(yùn)行以上代碼得出一元線性回歸
115、方程,y是體重,x是身高。對(duì)回歸方程進(jìn)行顯著性檢驗(yàn),檢驗(yàn)的p值等于0,小于0.05,說(shuō)明回歸方程顯著。</p><p> 4.4.3 身高、體重和肺活量的二元回歸</p><p> 調(diào)用LinearModel.fit函數(shù)對(duì)在用身高和體重做自變量,肺活量做因變量,做二元回歸,擬合效果圖如圖4-4所示,相應(yīng)代碼如下:</p><p> >> data=
116、xlsread('2010.xls');</p><p> >> x=data(:,3:4);</p><p> >> y=data(:,7);</p><p> >> mdl=LinearModel.fit(x,y)</p><p><b> mdl = </b&g
117、t;</p><p> Linear regression model:</p><p> y ~ 1 + x1 + x2</p><p> Estimated Coefficients:</p><p> Estimate SE tStat pValue </p><p&g
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 全國(guó)gdp的統(tǒng)計(jì)分析畢業(yè)論文
- 低碳生活統(tǒng)計(jì)分析 畢業(yè)論文
- 低碳生活統(tǒng)計(jì)分析 畢業(yè)論文
- 多元統(tǒng)計(jì)分析股票市場(chǎng)畢業(yè)論文
- 低碳生活統(tǒng)計(jì)分析 畢業(yè)論文.doc
- 票據(jù)貼現(xiàn)業(yè)務(wù)報(bào)表統(tǒng)計(jì)分析-畢業(yè)論文
- 大學(xué)生在校成績(jī)與高考成績(jī)的統(tǒng)計(jì)分析研究.pdf
- 【資料下載】多元統(tǒng)計(jì)分析畢業(yè)論文【原創(chuàng)精品】
- 發(fā)動(dòng)機(jī)典型故障的統(tǒng)計(jì)分析 畢業(yè)論文
- 多元統(tǒng)計(jì)分析論文
- 多元統(tǒng)計(jì)分析論文
- 嘉興市生態(tài)環(huán)境統(tǒng)計(jì)分析[畢業(yè)論文]
- 嘉興市醫(yī)療衛(wèi)生的統(tǒng)計(jì)分析[畢業(yè)論文]
- 我國(guó)電力消費(fèi)與經(jīng)濟(jì)增長(zhǎng)的統(tǒng)計(jì)分析【畢業(yè)論文】
- 浙江省能源消費(fèi)趨勢(shì)的統(tǒng)計(jì)分析[畢業(yè)論文]
- 學(xué)生評(píng)教成績(jī)的統(tǒng)計(jì)分析.pdf
- 在校生畢業(yè)典禮致辭
- 碩士研究生統(tǒng)計(jì)分析課程論文-關(guān)于保險(xiǎn)理賠業(yè)務(wù)數(shù)據(jù)綜合統(tǒng)計(jì)分析
- 食品安全事件大數(shù)據(jù)統(tǒng)計(jì)分析畢業(yè)論文
- 多元統(tǒng)計(jì)分析期末論文
評(píng)論
0/150
提交評(píng)論