變異系數(shù)_第1頁
已閱讀1頁,還剩80頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、169,第 5 章,樣本資料的數(shù)值分布,170,統(tǒng)計量(statistic)或表徵數(shù):依據(jù)樣本資料計算出具有特定意義的數(shù)值,是描述統(tǒng)計學(Descriptive Statistics)的主要內(nèi)容,也是推論統(tǒng)計學的推論基礎。統(tǒng)計量的測量(measure)或統(tǒng)計量的計算:定義和計算出統(tǒng)計量的過程或方法。,171,1.集中趨勢量數(shù)(measures of central tendency):位於圖形最高點附近的統(tǒng)計量,包含平均數(shù)(Mean

2、)、中位數(shù)(Median)和眾數(shù)(Mode);2.差異量數(shù)(measures of variability):集中趨勢量數(shù)平均數(shù)上下界限的統(tǒng)計量,包含標準差(Std deviation)和變異數(shù)(Variance);,曲線圖與統(tǒng)計量的關係:,172,3.大小量數(shù)(measures for size):位於圖形二極端點的統(tǒng)計量,包括最大值(Maximum)、最小值(Minimum)和全距(Range);4.偏差量數(shù)(measur

3、es of deviation from normality):表示圖形是否常態(tài)分布的統(tǒng)計量,包括偏態(tài)(Skewness)和峰度(Kurtosis)。,173,1.抽樣誤差(sampling error)或平均數(shù)穩(wěn)定性量數(shù)(measures of stability):用標準誤差(S.E. mean)來表示,是推論統(tǒng)計學的基礎;2.五數(shù)綜合(five-number summary)圖:最大值(Maximum) 、第一四分位數(shù)(fi

4、rst quartile)、中位數(shù)(Median)、第三四分位數(shù)(third quartile)和最小值(Minimum);,具有特殊意義的圖形或量數(shù):,174,3.盒形圖(boxplot):將五數(shù)綜合圖加上二個內(nèi)柵,用來找出離群值(outlier);4.相對變異量數(shù)(measures of relative variability):比較不同單位變項間的變異,例如變異係數(shù)(coefficient of variation)。,1

5、75,5.1常用數(shù)學運算符號,1.求總和的數(shù)學符號Σ(sigma):,176,5.1常用數(shù)學運算符號,3.用積分符號表示機率函數(shù):,(5.6),177,5.2集中趨勢量數(shù),集中趨勢量數(shù)(measures of central tendence)或中心位置量數(shù)(measures of central location):圖形最高點的統(tǒng)計量,平均數(shù)(Mean)、中位數(shù)(Median)或眾數(shù)(Mode)。,178,5.2.1算術平

6、均數(shù),179,5.2.2中位數(shù),180,5.2.2中位數(shù),181,5.2.3眾 數(shù),眾數(shù)(Mode)mo:出現(xiàn)次數(shù)最多次的值。眾數(shù)求算步驟如下: 1.將 n 個觀測值由小到大重新排列。 2.重複出現(xiàn)次數(shù)最多的觀測值就是眾數(shù)。,182,5.2.4集中量數(shù)間的關係,算術平均數(shù) 、中位數(shù) md 和眾數(shù) mo 關係圖形:,1.單峰對稱 (symmetric) 分布: 參閱圖 5.1。,圖5.1 單峰對稱分布,183

7、,2.單峰左偏 (skewed to left)分布: 參閱圖 5.2。,圖5.2 單峰左偏分布,5.2.4集中量數(shù)間的關係,184,3.單峰右偏 (skewed to right)分布: 參閱圖5.3。,圖5.3 單峰右偏分布,5.2.4集中量數(shù)間的關係,185,5.2.5平均數(shù)與中位數(shù)的使用時機,選用原則如下:,1.常態(tài)分布,二者皆可使用,優(yōu)先使用平均數(shù)。2.偏態(tài)分布,中位數(shù)比平均數(shù)具代表性。3.序位變

8、項或整群抽樣資料,使用中位數(shù)。4.指數(shù)或對數(shù)分布變項,使用中位數(shù)。5.母數(shù)推論統(tǒng)計法使用平均數(shù),無母數(shù)推論統(tǒng)計法使用中位數(shù)。,186,5.3平均數(shù)的差異量數(shù),差異量數(shù)(measures of variability)、離勢量數(shù)(measures of dispersion)或分散量數(shù)(measures of spread):表示分散情形的統(tǒng)計量,標準差(Standard deviation)和變異數(shù)(Variance)。,18

9、7,5.3.1變異數(shù),188,5.3.1變異數(shù),189,5.3.2標準差,190,5.3.2標準差,母體標準差:,(5 .15),變異數(shù)或標準差大,表示觀測值差異性或分散程度大。,191,5.4分布的大小量數(shù),大小量數(shù)(measures for size)或分布的分散(spread of the distribution):觀測值或圖形二極端值的統(tǒng)計量,最大值(Maximum)、最小值(Minimum)和全距(Range)。

10、最大值(Maximum):最大的觀測值。最小值(Minimum):最小的觀測值。全距R(Range):最大值 max 和最小值 min 的差:,(5 .16),192,5.5常態(tài)分布的偏差量數(shù),偏差量數(shù)(measures of deviation from normality):判斷資料是否常態(tài)分布的統(tǒng)計量,偏態(tài)(Skewness)和峰度(Kurtosis)。,193,判斷標準如下:,(1)高窄峰 (leptokurtic):

11、峰度 Kur > 3。(2)常態(tài)峰 (mesokurtic):峰度 Kur = 3。(3)低闊峰 (platykurtic):峰度 Kur < 3。,5.5.1峰 度,峰度(Kurtosis)或峰度係數(shù):量度尖(peakness)或平(flatness)程度的統(tǒng)計量:,(5.17),194,5.5.1峰 度,195,判斷標準:,(1)高窄峰 (leptokurtic):峰度 Kur > 0。參閱圖

12、5.5(2)常態(tài)峰 (mesokurtic):峰度 Kur = 0。參閱圖 5.1(3)低闊峰 (platykurtic):峰度 Kur < 0。參閱圖 5.4,5.5.1峰 度,196,5.5.1峰 度,197,5.5.2偏 態(tài),偏態(tài)(Skewness)或偏態(tài)係數(shù):量度偏離對稱程度的統(tǒng)計量:,(5.19),198,判斷標準如下:,(1)右偏 (skewed to the right):偏態(tài) Sk &g

13、t; 0。參閱圖 5.2。(2)對稱 (symmetry):偏態(tài) Sk = 0 。參閱圖 5.1。(3)左偏 (skewed to the left):偏態(tài)Sk < 0 。參閱圖 5.3。,5.5.2偏 態(tài),199,1.中距值(mid-range)與平均數(shù)比較,二數(shù)有明顯差異,是偏差形態(tài),中距值 MR:,5.5.3簡易判斷法,快速判斷偏差形態(tài)的方法:,(5.20),2.標準差與平均數(shù)比較,標準差超

14、過平均數(shù) 25%,是偏差形態(tài)。3.最大值和最小值與比較,超出 範圍,是偏差形態(tài)。,200,5.6穩(wěn)定性量數(shù),標準誤差(S.E. mean 或Standard errors)或標準誤:表示平均數(shù)穩(wěn)定性或抽樣誤差大小的統(tǒng)計量:,(5.21),201,5.7分布的比較及離群值,五數(shù)綜合(five-number summary)圖:最大值(maximum) 、第一四分位數(shù)(first quartile)、中位數(shù)(median)

15、、第三四分位數(shù)(third quartile)和最小值(minimum)。盒形圖(boxplot):由五數(shù)綜合圖增加二內(nèi)柵而成,用來找出離群值(outlier)。,202,5.7.1四分位數(shù),203,5.7.1四分位數(shù),4. 第二個分割點 50%的位置O(Q2)或O(md):,(5.8),204,5.7.1四分位數(shù),5. 第三個分割點 75% 的位置 O ( Q3 ):,(5.23),205,5.7.2五數(shù)綜合圖,五數(shù)綜合圖:

16、將最小值 min、第一四分位數(shù) Q1、中位數(shù) md、第三四分位數(shù) Q3 和最大值 max 依序按比例大小排列,五條垂直線表示五數(shù)的位置,然後在 Q1、md和 Q3之間繪出盒形,如圖 5.6 所示:,206,5.7.3四分位差,207,5.7.4盒形圖,盒形圖:將五數(shù)綜合圖中間的盒形邊緣向二端各延伸相同距離的內(nèi)柵(inner fence)。內(nèi)柵 IF 1和 IF2:,(5.27),208,5.7.4盒形圖,盒形圖如圖5.7所示:,

17、209,5.8相對離勢量數(shù),相對離勢量數(shù)(measures of relative dispersion):比較相同或不同單位變項間相對變異情形的統(tǒng)計量,例如變異係數(shù)(coefficient of variation)。變異係數(shù)(coefficient of variation) C.V.:標準差和算術平均數(shù)的比值:,(5.28),變異係數(shù)沒有單位,變異係數(shù)大者,該變項分散程度或差異性較大。,210,5.9偏態(tài)資料的處理,偏態(tài)資料

18、來源:,1.資料本身具有偏態(tài)的特性2.受離群值影響。,211,5.9.1 資料轉換,轉換前變數(shù) x 和轉換後變數(shù) x?,212,5.9.2 幾何平均數(shù),幾何平均數(shù) G:,(5.31),213,5.9.3 截尾算術平均數(shù),截尾算術平均數(shù)(trimmed mean)或修剪平均數(shù):,214,5.9.4 Windsorized 算術平均數(shù),Windsorized 算術平均數(shù)計算步驟如下:,1.求出 Q1 和 Q3。2.小於

19、Q1 的資料一律改成 Q1 的值。3.大於 Q3 的資料一律改成 Q3 的值。4.計算修改後的算術平均數(shù)。5.此種算術平均數(shù)稱為Windsorized 算術平均數(shù) (Windsorized mean)。,215,5.10例 題,216,217,218,219,220,221,222,223,224,225,226,,227,228,229,230,,231,232,233,,234,235,236,237,238,239,

20、240,241,242,243,244,245,5.10例 題,246,247,,248,5.11結 語,1.常態(tài)分布資料,算術平均數(shù)具有足夠代表性,使用母數(shù)統(tǒng)計法是最佳選擇。2.偏態(tài)分布資料,將資料轉換、刪除或修改成常態(tài)分布,然後使用母數(shù)統(tǒng)計法推論和分析。3.不能轉換或修改偏態(tài)分布資料,中位數(shù)比算術平均數(shù)更具代表性,使用無母數(shù)統(tǒng)計法是最佳的選擇。,249,5.11結 語,4.算術平均數(shù)搭配變異數(shù)或標準差,中位數(shù)通常四

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論