2023年全國(guó)碩士研究生考試考研英語(yǔ)一試題真題(含答案詳解+作文范文)_第1頁(yè)
已閱讀1頁(yè),還剩45頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、相關(guān)分析Correlation Analysis,謝寶煖臺(tái)灣大學(xué)圖書資訊學(xué)系pnhsieh@ntu.edu.tw2006年4月29日,量化研究與統(tǒng)計(jì)分析,一個(gè)例子,很多時(shí)候,我們想要知道一件事物與另一件事物之間的關(guān)係(relationship)而且希望能有個(gè)關(guān)係指標(biāo)(index of relationship)來說明關(guān)係強(qiáng)度,指標(biāo)小關(guān)係強(qiáng)度低,指標(biāo)大關(guān)係強(qiáng)度高;換句話說,需要有個(gè)「相關(guān)係數(shù)」(coefficient of co

2、rrelation)例如:有一盒玩具兵,我們對(duì)玩具兵的身高、體重有興趣,想像所有的玩具兵都是同樣的身形(shape),那麼身高不同體重也就不同,,看看這五個(gè)玩具兵,您會(huì)怎麼描述他們的身高和體重的關(guān)係?我們可以給個(gè) .00到1.00之間的數(shù)值來描述其關(guān)係強(qiáng)度(strength),同時(shí)說明關(guān)係的方向(direction),coefficient of correlation的種類,The rank-difference coeffici

3、ent (?)等級(jí)相關(guān)易理解排序資料Spearman rank-difference coefficient of correlationThe product-moment coefficient (r)常用連續(xù)資料Pearson product-moment coefficient,The rank-difference coefficient,將5個(gè)玩具兵的身高和體重加以排序?qū)⑾嗤蛭灰跃€段相連,線段形成階梯狀

4、計(jì)算每個(gè)玩具兵的身高和體重的排序差異(rank difference),請(qǐng)注意,所有的rank difference都是零計(jì)算rank-difference coefficient,以?(rho)表示,,?是1減掉分子為排序差異分母為比較的樣本,所以數(shù)值為介於0與1之間,而且排序排異愈大時(shí),可能會(huì)產(chǎn)生負(fù)的相關(guān)係數(shù),,,負(fù)相關(guān)如果換成真人的話,可能就不一定能和玩具兵一樣都有相同的身形,可能矮胖、高瘦,The product-momen

5、t coefficient (r),product-moment的意思其實(shí)通常我們不會(huì)計(jì)算排序差異,而是計(jì)算真實(shí)的身高和體重,如下表,,,,Concordant,Disconcordant,相關(guān)分析,當(dāng)變項(xiàng)為一個(gè)連續(xù)變數(shù)時(shí),可以次數(shù)分配和圖示來呈現(xiàn)資料的內(nèi)容與特性,或者以平均數(shù)和標(biāo)準(zhǔn)差來描繪資料的集中和離散情形。當(dāng)兩個(gè)變數(shù)皆為連續(xù)變數(shù)時(shí),則需利用相關(guān)(correlation)或迴歸(regression)來分析兩變數(shù)的關(guān)聯(lián)程度,又稱

6、為共變(covariance)關(guān)係。,線性關(guān)性,兩個(gè)連續(xù)變數(shù)的共變關(guān)係,可能有很多種形式,其中最簡(jiǎn)單也是最常見的關(guān)聯(lián)型態(tài)是線性關(guān)係(linear relationship)。兩個(gè)變項(xiàng)的關(guān)聯(lián)關(guān)係可以以一條最具有代表性的直線來表示例如:身高與體重,身高越高,體重也越重Y=bx+a x為身高,y為體重b為斜率,x每變動(dòng)一個(gè)單位, y的變動(dòng)量 身高每增加一公分,體重增加量當(dāng)b斜率為正值時(shí),表

7、示兩個(gè)變項(xiàng)是正相關(guān)當(dāng)b斜率為負(fù)值時(shí),表示兩個(gè)變項(xiàng)是負(fù)相關(guān),,,,,,,相關(guān)係數(shù),兩個(gè)連續(xù)變項(xiàng)的關(guān)聯(lián)情形可以散布圖來呈現(xiàn)精確的相關(guān)分析所產(chǎn)生的是一個(gè)相關(guān)係數(shù)(correlation coefficient),相關(guān)係數(shù)是介於-1與+1之間的數(shù)。若為+1 ,則表示兩變數(shù)具有完全的正線性相關(guān)若為-1,則表示兩變數(shù)具有完全的負(fù)線性相關(guān)若相關(guān)係數(shù)趨近於0,則表示兩變數(shù)沒有線性相關(guān)此一係數(shù)最早由Pearson所提出,又稱為皮氏積差相關(guān)係數(shù)

8、。,,Pearson相關(guān)係數(shù),相關(guān)係數(shù)值的大小,可以反應(yīng)兩個(gè)變項(xiàng)關(guān)聯(lián)性的強(qiáng)弱,但是相關(guān)係數(shù)是否具有統(tǒng)計(jì)上的意義,必須透過統(tǒng)計(jì)檢定來判斷。由樣本計(jì)算兩變項(xiàng)之相關(guān)係數(shù)Pearson’s r,若要推論到母群? ,必須經(jīng)由統(tǒng)計(jì)檢定由考驗(yàn)其統(tǒng)計(jì)意義虛無假設(shè)H0:兩變項(xiàng)X與Y不相關(guān) (相關(guān)係數(shù)為0, ? =0)對(duì)立假設(shè)H1:兩變項(xiàng)X與Y相關(guān) (相關(guān)係數(shù)不為0,

9、 ? ?0)當(dāng)雙尾的機(jī)率p小於設(shè)定的顯著水準(zhǔn)?(如0.05或0.01)時(shí),則否定虛無假設(shè),即相關(guān)係數(shù)不為零(兩變項(xiàng)相關(guān)),,以籃球得分為例。一個(gè)籃球隊(duì)獲勝場(chǎng)次與每場(chǎng)的平均得分有關(guān)連嗎?從散佈圖中可看出,它們具有線性關(guān)聯(lián)。我們?cè)購(gòu)?1994、1995 NBA 球季分析資料得知,Pearson 的相關(guān)係數(shù) (0.581) 在 0.01 水準(zhǔn)時(shí)是有意義的。於是可能猜想,每季所贏得的場(chǎng)次愈多,則對(duì)手的得分愈少。這些變數(shù)為負(fù)相關(guān) (0.401

10、),而相關(guān)在 0.05 水準(zhǔn)時(shí)最顯著。,相關(guān)分析,程序1統(tǒng)計(jì)圖?散佈圖X軸放自變項(xiàng);Y軸放依變項(xiàng)例:X軸為教育程度,Y軸為目前薪資(dataset: employee)由散佈圖可以很明顯地看出兩變數(shù)之相關(guān)程度。再由相關(guān)程序求出兩變數(shù)之相關(guān)係數(shù)程序2分析?相關(guān)? 雙變數(shù),由散佈圖可以很明顯地看出教育程度與目前薪資有正線性相關(guān)。為測(cè)量?jī)勺償?shù)之線性相關(guān)程度,以相關(guān)程序求出兩變數(shù)間之相關(guān)係數(shù)。,,,依Pearson相關(guān)係數(shù)可知,教

11、育程度和目前薪資的相 關(guān)係數(shù)為為0.661,P值為0.000。當(dāng)顯著水準(zhǔn)為0.01時(shí),可以得到教育程度與目前薪資有顯著相關(guān)的結(jié)論。,,,,相關(guān)係數(shù)對(duì)於定量、常態(tài)分配的變數(shù)而言,請(qǐng)選擇「Pearson」相關(guān)係數(shù)。如果資料不是常態(tài)分配,或已依類別排列,請(qǐng)選擇「Kendall‘s tau-b」或「Spearman」,以便測(cè)量等級(jí)排列之間的關(guān)聯(lián)。Spearman’s Rho(?)等級(jí)相關(guān)係數(shù)(順序變項(xiàng))Kendall‘s tau-b (

12、?)等級(jí)相關(guān)係數(shù)(concordant和諧)相關(guān)係數(shù)範(fàn)圍的值在 1 (一百分比負(fù)關(guān)聯(lián)) 到 +1 (一百分比正關(guān)聯(lián)) 之間。其中,數(shù)值 0表示沒有任何線性關(guān)係。在解析結(jié)果時(shí),請(qǐng)不要因?yàn)轱@著的相關(guān),而逕下任何跟因果相關(guān)的結(jié)論。,,Concordant:若某一觀察值的兩個(gè)變項(xiàng)值皆大於(或皆小於另一觀察值時(shí)),則稱此對(duì)觀察值為「一致」 (Concordant)。Discordant:若一觀察值的第一變項(xiàng)值大於另一觀察值,而第二變項(xiàng)值小於

13、另一觀察值時(shí),則稱此對(duì)觀察值為「不一致」(discordant)。Tied:若兩觀察值的一個(gè)變項(xiàng)或兩個(gè)變項(xiàng)值相等時(shí),則稱此對(duì)觀察值相等(tied)。,相關(guān)係數(shù),皮爾森相關(guān)(Pearson)由於Pearson樣本相關(guān)係數(shù)(?)之機(jī)率分配會(huì)依配對(duì)隨機(jī)變數(shù)(X,Y)之機(jī)率分配而變,所以沒有固定的分配,因此在做假設(shè)檢定時(shí),一般是假設(shè)(X,Y)具有二元的常態(tài)分配。Pearson相關(guān)係數(shù)之大小,可看出兩變項(xiàng)關(guān)係的密切程度。相關(guān)係數(shù)愈高,兩變項(xiàng)

14、之關(guān)係愈密切,愈低表示愈不相關(guān)。Spearman’s Rho(?)等級(jí)相關(guān)係數(shù),,相關(guān)顯著性訊號(hào)相關(guān)係數(shù)在 .05 水準(zhǔn)顯著時(shí),會(huì)以一個(gè)星號(hào)標(biāo)示,而在 .01水準(zhǔn)顯著時(shí),會(huì)以兩個(gè)星號(hào)標(biāo)示。,等級(jí)觀察值,轉(zhuǎn)換>等級(jí)觀察值,,等級(jí)變項(xiàng)之相關(guān)係數(shù)為Spearman相關(guān)係數(shù),,多個(gè)雙變量相關(guān)分析,負(fù)相關(guān),,沒有相關(guān),,淨(jìng)相關(guān)與部份相關(guān),如果兩個(gè)連續(xù)變項(xiàng)之間的關(guān)係,可能受到第三個(gè)變項(xiàng)干擾時(shí),也可以以共變分析的做法,將第三個(gè)變項(xiàng)進(jìn)行統(tǒng)計(jì)上的控制

15、。淨(jìng)相關(guān)在計(jì)算兩個(gè)連續(xù)變項(xiàng)X1和X2的相關(guān)時(shí),將第三變項(xiàng)( X3 )與兩個(gè)相關(guān)變項(xiàng)的相關(guān)X13和X23 ,加以排除之後的單純相關(guān),以X12.3來表示。部份相關(guān)淨(jìng)相關(guān)是將第三個(gè)變項(xiàng)與兩個(gè)連續(xù)變項(xiàng)X1和X2的相關(guān)完全排除之後,計(jì)算的單純相關(guān)。如果在計(jì)算排除效果時(shí),只處理第三變項(xiàng)與X1和X2當(dāng)中的一個(gè)變項(xiàng)的相關(guān)時(shí),所計(jì)算出來的相關(guān)係數(shù),稱之為部份相關(guān)(partial correlation) ,或稱半淨(jìng)相關(guān)(semipartial c

16、orrelation)。,,同時(shí)測(cè)得學(xué)生的期中考、期末考成績(jī),以及統(tǒng)計(jì)焦慮分?jǐn)?shù),請(qǐng)問期中考與期末考成績(jī)的淨(jìng)相關(guān)如何??jī)蓚€(gè)部份相關(guān)又如何?程序:分析>相關(guān)>偏相關(guān)選項(xiàng)>勾選零階相關(guān) 成對(duì)排除遺漏值,,,零階相關(guān)係數(shù)期中考與期末考的Pearson相關(guān)為.8219, p=.004達(dá)到顯著水準(zhǔn)。顯示期中考與期末考成績(jī)具有高度相關(guān)。焦慮與期中考的相關(guān)為-.8145,且達(dá)到顯著(p=.004);焦慮與期末考的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論