簡(jiǎn)單試驗(yàn)的統(tǒng)計(jì)分析_第1頁(yè)
已閱讀1頁(yè),還剩70頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、試驗(yàn)設(shè)計(jì)與分析,第二章 簡(jiǎn)單試驗(yàn)的統(tǒng)計(jì)分析主講教師 張曉科,講授內(nèi)容和學(xué)時(shí),講授內(nèi)容 學(xué)時(shí)第一節(jié) 參數(shù)假設(shè)測(cè)驗(yàn) 2第二節(jié) 參數(shù)的區(qū)間估計(jì) 2第三節(jié) 非參數(shù)假設(shè)測(cè)驗(yàn) 4,引 言,一個(gè)處理和兩個(gè)處理的試驗(yàn)稱為簡(jiǎn)單試驗(yàn),它通常采用按設(shè)置重復(fù)和隨機(jī)化兩個(gè)原則進(jìn)行的完全隨機(jī)設(shè)計(jì),兩個(gè)處理試驗(yàn)的設(shè)計(jì)有時(shí)也采用更精細(xì)的配對(duì)設(shè)計(jì)。統(tǒng)計(jì)分

2、析的目的,是從樣本推斷總體的分布,其過(guò)程稱為推斷統(tǒng)計(jì)。推斷統(tǒng)計(jì)的內(nèi)容大致分為兩類,一是有關(guān)總體的假設(shè)檢驗(yàn)問(wèn)題,二是有關(guān)總體的參數(shù)估計(jì)問(wèn)題。,第一節(jié) 參數(shù)假設(shè)測(cè)驗(yàn),一、統(tǒng)計(jì)假設(shè)測(cè)驗(yàn)的基本原理 二、平均數(shù)的假設(shè)測(cè)驗(yàn)三、方差的假設(shè)測(cè)驗(yàn)四、假設(shè)測(cè)驗(yàn)的兩類錯(cuò)誤,一、統(tǒng)計(jì)假設(shè)測(cè)驗(yàn)的基本原理,(一)提出統(tǒng)計(jì)假設(shè) 1. 統(tǒng)計(jì)假設(shè)的概念 2. 假設(shè)的種類 3. 提出無(wú)效假設(shè)的原因(

3、二)統(tǒng)計(jì)假設(shè)測(cè)驗(yàn) 1. 統(tǒng)計(jì)假設(shè)測(cè)驗(yàn)的概念 2. 方法(三)作出推斷 1. 推斷的原理 2. 推斷的方法,(一)提出統(tǒng)計(jì)假設(shè),1. 什么叫統(tǒng)計(jì)假設(shè):對(duì)總體的某些參數(shù)所作的假設(shè)。實(shí)例:假設(shè)某地大面積種植玉米品種單產(chǎn)為每公頃7500㎏,標(biāo)準(zhǔn)差為1125㎏。即總體平均數(shù)μ0=7500㎏,σ=1125㎏?,F(xiàn)從外地引入一新品種,通過(guò)25個(gè)小區(qū)試驗(yàn),平均產(chǎn)量為每公

4、頃7950㎏,即 ㎏。 問(wèn)新引入品種的產(chǎn)量與當(dāng)?shù)卮竺娣e種植品種有無(wú)顯著差異?即新引入品種產(chǎn)量的總體平均數(shù)μ與大面積種植品種總體產(chǎn)量的平均數(shù)μ0是否不等。僅從抽樣結(jié)果 ㎏,還不能得出 的結(jié)論。這是因?yàn)槲覀冄芯康膬H是從總體中抽出的一部分個(gè)體所組成的樣本,而不是總體本身,因而不可避免地存在著試驗(yàn)的抽樣誤差。由于試驗(yàn)誤差的隨機(jī)性,若重復(fù)試驗(yàn), 的取值很可能不再是

5、7950㎏。怎樣由樣本的試驗(yàn)結(jié)果給總體作一結(jié)論呢?這就是統(tǒng)計(jì)假設(shè)檢驗(yàn)要解決的問(wèn)題。,,,,,2. 假設(shè)的種類,無(wú)效假設(shè) 假設(shè)總體參數(shù)與某一指定值相等或假設(shè)兩個(gè)總體參數(shù)相等。即在實(shí)例中,H0:μ=μ0 =7500 kg。備擇假設(shè)或?qū)?yīng)假設(shè) 假設(shè)總體參數(shù)與某一指定值不相等或假設(shè)兩個(gè)總體參數(shù)不相等。即在實(shí)例中,HA:μ≠μ0 =7500 kg。兩者關(guān)系 備擇假設(shè)的意思是說(shuō),如果否定了無(wú)效假設(shè)則當(dāng)然接受備擇假設(shè);如果接受

6、了無(wú)效假設(shè),當(dāng)然也就否定了備擇假設(shè)。在無(wú)效假設(shè)和備擇假設(shè)中,無(wú)效假設(shè)是被直接測(cè)驗(yàn)的假設(shè)。,3. 為什么要提出無(wú)效假設(shè),提出無(wú)效假設(shè)的目的在于:可以從假設(shè)的總體里推斷其某一統(tǒng)計(jì)數(shù)的隨機(jī)抽樣分布,從而可以計(jì)算出某一樣本結(jié)果出現(xiàn)的概率,這樣就可以研究樣本和總體的關(guān)系,作為假設(shè)檢驗(yàn)的理論依據(jù)。因此,提出的無(wú)效假設(shè)必須是有意義的,即在假設(shè)的前提下可以確定試驗(yàn)結(jié)果的概率。,(二)統(tǒng)計(jì)假設(shè)測(cè)驗(yàn),1. 什么叫統(tǒng)計(jì)假設(shè)測(cè)驗(yàn) 試驗(yàn)樣本平均值與總體平

7、均值差異的構(gòu)成有三種可能性:(1)既有真實(shí)差異又有試驗(yàn)誤差;(2) 全為真實(shí)差異;(3) 全為試驗(yàn)誤差。在農(nóng)業(yè)及生物試驗(yàn)中,非處理因素對(duì)試驗(yàn)指標(biāo)(如玉米產(chǎn)量)的干擾總是存在的,因而第二種可能性實(shí)際上不存在。第一種可能性既有真實(shí)差異又有試驗(yàn)誤差,不便于討論。這樣統(tǒng)計(jì)推斷只能由第三種可能性出發(fā),先假設(shè)真實(shí)差異不存在,試驗(yàn)表面差異全為試驗(yàn)誤差。然后,計(jì)算該假設(shè)(可視為一隨機(jī)事件)出現(xiàn)的概率,根據(jù)概率的大小來(lái)判斷假設(shè)是否正確,即真實(shí)差異是否存在

8、。這一過(guò)程為對(duì)試驗(yàn)樣本所屬總體所作假設(shè)是否正確的統(tǒng)計(jì)證明,一般稱統(tǒng)計(jì)假設(shè)檢驗(yàn)或假設(shè)測(cè)驗(yàn)。因此,統(tǒng)計(jì)假設(shè)檢驗(yàn)沒(méi)有復(fù)雜的統(tǒng)計(jì)運(yùn)算,更多的是邏輯推斷。,2. 方法,假設(shè)測(cè)驗(yàn)方法是先按研究目的提出一個(gè)假設(shè);然后通過(guò)試驗(yàn)或調(diào)查,取得樣本資料;最后檢查這些資料結(jié)果,看看是否和假設(shè)所提出的有關(guān)總體參數(shù)的結(jié)果相符合。如果兩者之間甚為符合,則接受這個(gè)假設(shè)H0;如果不符合,則否定它,即推斷這個(gè)假設(shè)是錯(cuò)誤的,因而接受其對(duì)應(yīng)假設(shè)HA。,(三)作出推斷,1

9、. 推斷的原理當(dāng)一事件的概率很小時(shí),可認(rèn)為該事件在一次試驗(yàn)中幾乎是不可能事件。這就是“小概率事件實(shí)際不可能性”原理。我們將用此原理決定接受或否定假設(shè)H0。當(dāng)表面差異全由隨機(jī)誤差造成的概率小于0.05或0.01時(shí),我們就可認(rèn)為它不可能全屬于抽樣誤差,從而否定無(wú)效假設(shè)H0 ,接受備擇假設(shè)HA 。用來(lái)判斷是否屬于小概率事件的概率值叫顯著水平。一般以α表示。在農(nóng)業(yè)試驗(yàn)中,常取0.05或0.01,記為α=0.05或α=0.01。,(三)作出推

10、斷,2. 推斷的方法統(tǒng)計(jì)假設(shè)檢驗(yàn)的基本步驟:(1) 對(duì)樣本所屬總體提出統(tǒng)計(jì)假設(shè),包括無(wú)效假設(shè)H0和備擇假設(shè)HA;(2) 確定顯著水平α;(3) 測(cè)驗(yàn)計(jì)算,即在無(wú)效假設(shè)H0正確的假定下,依據(jù)統(tǒng)計(jì)數(shù)的抽樣分布,計(jì)算因隨機(jī)抽樣而獲得實(shí)際差數(shù)的概率;(4) 統(tǒng)計(jì)推斷,即將確定的值與算得的概率相比較,依據(jù)“小概率事件實(shí)際不可能性”原理作出接受或否定無(wú)效假設(shè)的推斷。,二、平均數(shù)的假設(shè)測(cè)驗(yàn),(一)單個(gè)樣本平均數(shù)的假設(shè)測(cè)驗(yàn)(二)兩個(gè)樣本平均

11、數(shù)相比較的假設(shè)測(cè)驗(yàn) (三)百分?jǐn)?shù)資料的假設(shè)測(cè)驗(yàn),(一)單個(gè)樣本平均數(shù)的假設(shè)測(cè)驗(yàn),1. 來(lái)自σ2已知總體的樣本平均數(shù)的測(cè)驗(yàn) 講雙尾測(cè)驗(yàn)例子;講顯著水平;講查u表2. 來(lái)自σ2未知總體的大樣本平均數(shù)的測(cè)驗(yàn) 講單尾測(cè)驗(yàn)例子;比較單、雙尾測(cè)驗(yàn)3. 來(lái)自σ2未知總體的小樣本平均數(shù)的測(cè)驗(yàn)(1) t分布 ① 特點(diǎn):4條 ② t分布的概率(2)t測(cè)驗(yàn):比較t測(cè)驗(yàn)與u測(cè)驗(yàn),1. 來(lái)自σ2已知總體的樣本平均數(shù)的測(cè)

12、驗(yàn),實(shí)例:某小麥良種的千粒重服從N(μ0,σ2),μ0=33.5 g, σ2 =1.6 g?,F(xiàn)從外地引入一高產(chǎn)品種,在8個(gè)小區(qū)種植,得千粒重(g):35.6、37.6、33.4、35.1、32.7、36.8、35.9、34.6。問(wèn)新引入品種的千粒重與當(dāng)?shù)仄贩N有無(wú)顯著差異(α=0.05)?,實(shí)例分析:雙尾測(cè)驗(yàn)、顯著水平、查u表,假設(shè): , 顯著水平: 檢驗(yàn)計(jì)算: =推斷:查

13、u的雙尾分位數(shù)表得: 。由于 ,P<0.01,故否定H0而接受HA。其意義為:在顯著水平 之下,有極顯著的差異(用“**”表示)。,,,,,,,,,,u雙尾測(cè)驗(yàn)圖示,(上述例題中α=0.01, μ=33.5 g , σ2 =1.6 g , n=8 , ),2. 來(lái)自σ2未知總體的大樣本平均數(shù)的測(cè)驗(yàn),大樣本:n≥30在這種情況下,,,

14、單尾與雙尾測(cè)驗(yàn)比較,1.兩尾尾測(cè)驗(yàn):否定區(qū)域?yàn)檎龖B(tài)分布或t分布左右兩個(gè)尾部的測(cè)驗(yàn)稱為兩尾測(cè)驗(yàn)。2.一尾測(cè)驗(yàn):否定區(qū)域僅為正態(tài)分布或t分布的一尾(左邊一尾或右邊一尾)的測(cè)驗(yàn)稱為一尾測(cè)驗(yàn)。若否定區(qū)域在左邊一尾稱為左尾測(cè)驗(yàn),在右邊一尾稱為右尾測(cè)驗(yàn)。3.兩尾測(cè)驗(yàn)與一尾測(cè)驗(yàn)在測(cè)驗(yàn)中的異同:相同點(diǎn): (1)兩種測(cè)驗(yàn)的測(cè)驗(yàn)步驟相同。 (2)在單個(gè)樣本平均數(shù)、兩個(gè)樣本平均數(shù)相比較的假設(shè)測(cè)驗(yàn)中都可應(yīng)用。 (3)都可應(yīng)用u測(cè)驗(yàn)或t測(cè)驗(yàn)。不同點(diǎn)

15、: (1)假設(shè)的形式略有不同。 兩尾:H0:μ=μ0;HA:μ≠μ0 H0:μ1=μ2;HA:μ1≠μ2 一尾:左尾:H0:μ≥μ0;HA:μ<μ0 H0:μ1≥μ2;HA:μ1<μ2 右尾:H0:μ≤μ0;HA:μ>μ0 H0:μ1≤μ2;HA:μ1>μ2

16、 (2)查u表或t表時(shí)α值有差異:兩尾測(cè)驗(yàn)可直接用顯著水平α查兩尾u值表示或t值表;一尾測(cè)驗(yàn)則需用2α查兩尾u值表或t值表。,u雙尾測(cè)驗(yàn)(上)與單尾測(cè)驗(yàn)(下)圖示比較,3. 來(lái)自σ2未知總體的小樣本平均數(shù)的測(cè)驗(yàn) t分布,t分布的密度函數(shù)曲線關(guān)于對(duì)稱,其形狀與自由度n有關(guān)。密度曲線與t軸間的面積為1 。t值落入?yún)^(qū)間(-tα,tα)外的概率為α,即

17、 只要知道t分布的自由度n和就可查到,這樣的表稱為t分布的雙側(cè)分位數(shù)表,附在書(shū)后備用。,,(2) u測(cè)驗(yàn)與t測(cè)驗(yàn)比較,應(yīng)用條件u測(cè)驗(yàn)應(yīng)用的條件(1)總體方差σ2已知;(2)總體方差σ2未知,但樣本容量n≥30的測(cè)驗(yàn)。t測(cè)驗(yàn)應(yīng)用 總體方差未知且n<30的小樣本測(cè)驗(yàn)。計(jì)算公式和查表u測(cè)驗(yàn)計(jì)算u值,查u表。t測(cè)驗(yàn)計(jì)算t值,查t表。,(二)兩個(gè)樣本平均數(shù)相比較的假設(shè)測(cè)驗(yàn),概述1. 成組數(shù)據(jù)的平均數(shù)比較(1) 在兩個(gè)樣本

18、的總體方差已知時(shí),采用u測(cè)驗(yàn)(2) 兩個(gè)樣本的總體方差未知,但可假設(shè)σ12=σ22,而兩個(gè)樣本又為小樣本時(shí),用t測(cè)驗(yàn):講求合并均方(3) 兩個(gè)樣本的總體方差未知,且σ12≠σ22,而兩個(gè)樣本又為小樣本時(shí),用t測(cè)驗(yàn);矯正。2. 成對(duì)數(shù)據(jù)的比較,(二)兩個(gè)樣本平均數(shù)相比較的假設(shè)測(cè)驗(yàn),含義:這是由兩個(gè)樣本平均數(shù)的相差,以測(cè)驗(yàn)這兩個(gè)樣本所屬的總體平均數(shù)有無(wú)顯著差異。分類:測(cè)驗(yàn)方法因試驗(yàn)設(shè)計(jì)的不同,而可分成組數(shù)據(jù)的平均數(shù)比較和成對(duì)數(shù)據(jù)的

19、比較兩種。成組數(shù)據(jù)的平均數(shù)的比較:如果兩個(gè)處理為完全隨機(jī)設(shè)計(jì),而處理間(組間)的各供試單位彼此獨(dú)立,則不論兩處理的樣本容量是否相同,所得數(shù)據(jù)皆稱為成組數(shù)據(jù),以組(處理)平均數(shù)作為相互比較的標(biāo)準(zhǔn)。 成對(duì)數(shù)據(jù)的比較:若試驗(yàn)設(shè)計(jì)是將性質(zhì)相同的兩個(gè)供試單位配成一對(duì),并設(shè)有多個(gè)配對(duì);然后每一配對(duì)的兩個(gè)供試單位分別隨機(jī)地給予不同處理,則所得觀察值為成對(duì)數(shù)據(jù)。,1. 成組數(shù)據(jù)的平均數(shù)比較,成組數(shù)據(jù)的比較又依兩個(gè)樣本所屬的總體方差是否已知和樣本大小

20、而采用不同的測(cè)驗(yàn)方法。 (1) 在兩個(gè)樣本的總體方差已知時(shí),采用u測(cè)驗(yàn)(2) 兩個(gè)樣本的總體方差未知,但可假設(shè)σ12=σ22,而兩個(gè)樣本又為小樣本時(shí),用t測(cè)驗(yàn)。(3) 兩個(gè)樣本的總體方差未知,且σ12≠σ22,而兩個(gè)樣本又為小樣本時(shí),用t測(cè)驗(yàn)。,2. 成對(duì)數(shù)據(jù)的比較,采用配對(duì)試驗(yàn)設(shè)計(jì)法,其實(shí)質(zhì)是把兩個(gè)處理同一重復(fù)內(nèi)的兩個(gè)試驗(yàn)單元的差異減少到最低限度,使兩個(gè)處理間的效應(yīng)差異不為試驗(yàn)單元間的差異所掩蓋和混淆.如田間試驗(yàn)中將兩個(gè)處理的

21、每一次重復(fù)的兩個(gè)試驗(yàn)小區(qū)排在一起,因?yàn)橄噜徯^(qū)的條件較為一致。,2. 成對(duì)數(shù)據(jù)的比較,實(shí)例:為測(cè)定甲、乙兩種病毒對(duì)煙草的致病力。取8株煙草,每一株皆半葉隨機(jī)接種甲病毒,另半葉接種乙病毒,以葉面出現(xiàn)枯斑數(shù)多少作為致病力強(qiáng)弱的指標(biāo),結(jié)果見(jiàn)下表。試檢驗(yàn)兩種病毒致病力的差異顯著性(α=0.05)。,不同病毒對(duì)煙草致病力的試驗(yàn)結(jié)果,實(shí)例分析,假設(shè): , 顯著水平:測(cè)驗(yàn)計(jì)算:

22、 。 推斷:查t表得 ,故可直接推斷甲病毒的致病力比乙病毒強(qiáng)(貫徹了雙尾假設(shè)H0被否定后單尾假設(shè)二者必取其一的原則)。,,,,,,,,(三)百分?jǐn)?shù)資料的假設(shè)測(cè)驗(yàn),引言1. 單個(gè)樣本百分?jǐn)?shù)的假設(shè)測(cè)驗(yàn)2. 兩個(gè)樣本百分?jǐn)?shù)的假設(shè)測(cè)驗(yàn)3. 二項(xiàng)樣本假設(shè)測(cè)驗(yàn)時(shí)的連續(xù)性矯正(1) 原因(2) 矯正方法① 單個(gè)樣本百分?jǐn)?shù)的連續(xù)性矯正 ② 兩個(gè)樣本百分?jǐn)?shù)的連續(xù)性矯正,(三)百分?jǐn)?shù)資料的假

23、設(shè)測(cè)驗(yàn),單個(gè)處理的隨機(jī)化試驗(yàn)結(jié)果有時(shí)用百分率表示,如結(jié)實(shí)率、發(fā)芽率、殺蟲(chóng)率、病株率,以及雜交后代分離成不同類型的百分率等。這些資料屬間斷性的計(jì)數(shù)資料,應(yīng)按二項(xiàng)分布分析。由于當(dāng)np或(q = 1-p)均大于5時(shí),二項(xiàng)分布趨近于正態(tài)分布,因此,當(dāng)np或nq均大于30時(shí),可直接按正態(tài)分布處理;否則需進(jìn)行連續(xù)性校正后,再按正態(tài)分布對(duì)待。,(三)百分?jǐn)?shù)資料的假設(shè)測(cè)驗(yàn),1. 單個(gè)樣本百分?jǐn)?shù)的假設(shè)測(cè)驗(yàn)含義:這是測(cè)驗(yàn)?zāi)骋粯颖景俜謹(jǐn)?shù)與某一理論值或期望

24、值的差異顯著性。2. 兩個(gè)樣本百分?jǐn)?shù)的假設(shè)測(cè)驗(yàn)含義:這是測(cè)驗(yàn)兩個(gè)樣本百分?jǐn)?shù)的差異顯著性,一般假設(shè)兩個(gè)樣本的總體方差是相等的。,3. 二項(xiàng)樣本假設(shè)測(cè)驗(yàn)時(shí)的連續(xù)性矯正,(1)原因: 二項(xiàng)總體的百分?jǐn)?shù)是由某一屬性的個(gè)體數(shù)計(jì)算來(lái)的,在性質(zhì)上屬于間斷性變異,其分布是間斷性的二項(xiàng)分布。因而把它當(dāng)作連續(xù)性的正態(tài)分布或t分布處理,結(jié)果會(huì)有出入。(2)方法:補(bǔ)救的方法是在測(cè)驗(yàn)時(shí)進(jìn)行連續(xù)性矯正。單個(gè)樣本百分?jǐn)?shù)的假設(shè)測(cè)驗(yàn)兩個(gè)樣本百分?jǐn)?shù)的假設(shè)測(cè)驗(yàn),,

25、,三、方差的假設(shè)測(cè)驗(yàn),(一)單個(gè)方差的假設(shè)測(cè)驗(yàn)(二)兩個(gè)方差相比較的假設(shè)測(cè)驗(yàn),(一)單個(gè)方差的假設(shè)測(cè)驗(yàn),1. 卡平方分布(1)卡方值 (2)卡平方分布(3)卡方分布曲線的特征(4)卡方值表2. 卡平方的測(cè)驗(yàn)方法 測(cè)驗(yàn)步驟,1. 卡平方分布,卡方值次數(shù)資料的統(tǒng)計(jì)分析方法可用卡平方測(cè)驗(yàn)法。χ2值的計(jì)算方式為:χ2=∑(O-E)2/E ,式中的O為觀察次數(shù),E為理論次數(shù)。當(dāng)χ2值的下限為零,表示觀察次數(shù)與理論次數(shù)完全

26、符合;上限為+∞,表示觀察次數(shù)和理論次數(shù)的差異增大時(shí),χ2值也增大。,卡平方分布,2. 卡平方的測(cè)驗(yàn)方法,(1) 測(cè)驗(yàn)步驟設(shè)立無(wú)效假設(shè)確定顯著水平α=0.05或0.01在無(wú)效假設(shè)為正確的假設(shè)下,計(jì)算超過(guò)觀察χ2值的概率以所得概率的大小,接受或否定無(wú)效假設(shè),(二)兩個(gè)方差相比較的假設(shè)測(cè)驗(yàn),1. F分布(1)F值 (2)F分布(3)F分布的特征 5條(4)F值表2. F測(cè)驗(yàn)(1)基本條件(2)測(cè)驗(yàn)步驟,1. F分布,

27、2. F測(cè)驗(yàn),F分布基本條件變數(shù)x遵循正態(tài)分布兩樣本方差彼此獨(dú)立測(cè)驗(yàn)步驟與t或u測(cè)驗(yàn)一樣,有四個(gè)步驟,四、假設(shè)測(cè)驗(yàn)的兩類錯(cuò)誤,(-)為什么會(huì)發(fā)生錯(cuò)誤?(二)錯(cuò)誤的類型 1. 第一類錯(cuò)誤 2. 第二類錯(cuò)誤(三)犯錯(cuò)誤的概率 1. 犯第一類錯(cuò)誤的概率 2. 犯第二類錯(cuò)誤的概率(四)減小犯錯(cuò)誤的途徑 4條,(-)為什么會(huì)發(fā)生錯(cuò)誤?,由試驗(yàn)的一個(gè)樣本點(diǎn)

28、決斷H0的成立與否,這是由結(jié)果推斷原因的做法,屬歸納推理。歸納推理的結(jié)果使我們可能犯錯(cuò)誤。 由于隨機(jī)誤差的作用,所得到的任何一次試驗(yàn)結(jié)果都不是一個(gè)必然事件,只根據(jù)一次試驗(yàn)結(jié)果所作的推斷,可以看成是以一定的可靠程度而作出的結(jié)論,難免會(huì)帶有一定的錯(cuò)誤。,(二/三)錯(cuò)誤的類型和犯錯(cuò)誤的概率,第一類錯(cuò)誤是:H0正確,而樣本點(diǎn)碰巧落入H0的否定域而接受HA,這種錯(cuò)誤稱為棄真錯(cuò)誤,棄真錯(cuò)誤的概率為α。第二類錯(cuò)誤是: H0不真,而樣本點(diǎn)碰巧落入H

29、0的接受域而接受了H0 ,這種錯(cuò)誤稱為納偽錯(cuò)誤。納偽錯(cuò)誤的概率為β。β的大小與H0不真的程度及H0接受域的長(zhǎng)短有關(guān)。 H0不真的程度越大、1-α越大( H0接受域越長(zhǎng)),則β越大。,(四)減小犯錯(cuò)誤的途徑,① 在樣本容量n固定的條件下,提高顯著水平(取較小的α值),則將增大犯第二類錯(cuò)誤的概率β值。② 在n和顯著水平α相同的條件下,真總體平均數(shù)μ和假設(shè)平均數(shù)μ0的相差(以標(biāo)準(zhǔn)誤為單位)愈大,則犯第二類錯(cuò)誤的概率β值愈小。③ 為了同時(shí)降

30、低犯兩類錯(cuò)誤的概率,需采用一個(gè)較低的顯著水平,如α=0.05;同時(shí)適當(dāng)增加樣本容量n,或適當(dāng)減小總體方差σ2,或兩者兼而有之。④ 若顯著水平α已固定下來(lái),則增加樣本容量和改進(jìn)試驗(yàn)技術(shù)可以有效地降低犯第二類錯(cuò)誤的概率。,第二節(jié) 參數(shù)的區(qū)間估計(jì),-、基本概念二、區(qū)間估計(jì)的特點(diǎn)三、區(qū)間估計(jì)的方法四、區(qū)間估計(jì)與假設(shè)測(cè)驗(yàn),-、基本概念,參數(shù)的點(diǎn)估計(jì):以樣本的統(tǒng)計(jì)數(shù)直接估計(jì)總體的相應(yīng)參數(shù)。參數(shù)的區(qū)間估計(jì):在一定的概率保證之下,估計(jì)出參數(shù)

31、可能在內(nèi)的一個(gè)范圍或區(qū)限。這個(gè)區(qū)間稱置信區(qū)間或置信距,區(qū)間的上、下限稱為置信限。保證參數(shù)在該區(qū)間內(nèi)的概率以P=(1-α)表示,稱為置信系數(shù)或置信度。,二、區(qū)間估計(jì)的特點(diǎn),置信度1-α通常取接近1的值,在實(shí)際應(yīng)用中常取95%和99%,體現(xiàn)了置信水平的中、高兩個(gè)檔次。為什么這樣取,這是由于存在著估計(jì)精度與置信度的此長(zhǎng)彼消的矛盾。區(qū)間的平均長(zhǎng)度越短,精度越高,置信度越?。环粗仍降?,置信度越大。統(tǒng)計(jì)學(xué)的原則是在可靠度優(yōu)先的前提下,尋找

32、盡可能短的區(qū)間估計(jì)。,三、區(qū)間估計(jì)的方法,(一)總體平均數(shù)μ的置信區(qū)間估計(jì)(二)總體方差的置信區(qū)間估計(jì),(一)總體平均數(shù)μ的置信區(qū)間估計(jì),1. 總體平均數(shù)μ的置信限(詳講)2. 兩個(gè)總體平均數(shù)差數(shù)的置信限3. 二項(xiàng)總體百分?jǐn)?shù)的置信限4. 兩個(gè)二項(xiàng)總體百分?jǐn)?shù)差數(shù)的置信限,1. 總體平均數(shù)μ的置信限,當(dāng)σ2已知時(shí),μ的置信區(qū)間和置信上、下限當(dāng)σ2未知且時(shí), μ的置信區(qū)間和置信上、下限,,,2. 兩個(gè)總體平均數(shù)差數(shù)的置信限,當(dāng)

33、兩個(gè)方差已知,其置信區(qū)間和置信上、下限當(dāng)未知且不相等,樣本容量大于30時(shí),其置信區(qū)間和置信上、下限當(dāng)未知相等且容量小于30時(shí),其置信區(qū)間和置信上、下限,,,,3. 二項(xiàng)總體百分?jǐn)?shù)的置信限,上限下限,,,4. 兩個(gè)二項(xiàng)總體百分?jǐn)?shù)差數(shù)的置信限,上限下限,,,(二)總體方差的置信區(qū)間估計(jì),1. 單個(gè)方差的區(qū)間估計(jì)2. 兩個(gè)方差比的區(qū)間估計(jì),1. 單個(gè)方差的區(qū)間估計(jì),總體方差的區(qū)間估計(jì) 當(dāng)μ已知時(shí),方差置信區(qū)間和置信上、

34、下限當(dāng)μ未知時(shí),方差置信區(qū)間和置信上、下限,,,2. 兩個(gè)方差比的區(qū)間估計(jì),,四、區(qū)間估計(jì)與假設(shè)測(cè)驗(yàn),若在1-α的置信度下,兩個(gè)置信限同為正號(hào)或同為負(fù)號(hào),在α水平上否定H0而接受HA。若在1-α的置信度下,兩個(gè)置信限同為異號(hào)或一正一負(fù),在α水平上接受H0。若兩個(gè)置信限同為正號(hào),則有μ1>μ2,p1>p2。若兩個(gè)置信限同為負(fù)號(hào),則有μ1<μ2,p1<p2。,第三節(jié) 非參數(shù)假設(shè)測(cè)驗(yàn),一、分布的適合性測(cè)驗(yàn)二、適合性測(cè)驗(yàn)(一)k

35、=2的適合性測(cè)驗(yàn) (二)k≥3的適合性測(cè)驗(yàn) 三、 獨(dú)立性測(cè)驗(yàn)(一)2×2相依表的獨(dú)立性測(cè)驗(yàn)(二)2×c相依表的獨(dú)立性測(cè)驗(yàn)(三)r×c相依表的獨(dú)立性測(cè)驗(yàn)四、卡方的可加性和合并比較,一、分布的適合性測(cè)驗(yàn),在分布的檢驗(yàn)問(wèn)題中,我們并不能預(yù)知變量X的分布,需要根據(jù)樣本作出隨機(jī)變量X的分布函數(shù)是否為已知函數(shù)F0(x)的判斷,因此分布的檢驗(yàn)問(wèn)題是非參數(shù)檢驗(yàn)問(wèn)題。分布的檢驗(yàn)假設(shè)為:用什么統(tǒng)計(jì)量來(lái)度量經(jīng)

36、驗(yàn)分布函數(shù)與假設(shè)分布函數(shù)的符合程度呢?一般采用皮爾遜X2統(tǒng)計(jì)量檢驗(yàn)方法。,,實(shí)例分析,實(shí)例:調(diào)查玉米受玉米螟為害情況,抽取100株,受害株22。試檢驗(yàn)H0:每次抽一株得到受害株的概率。分析:按題意是要檢驗(yàn)總體X是否服從的(0,1)分布。由抽樣結(jié)果知,100株中有22株受害和78株未受害.在H0之下,100株中應(yīng)有20株受害和80株未受害,則 由自由度 ,查附表得

37、 ,故應(yīng)接受H0 。,,,,二、適合性測(cè)驗(yàn) (一)k=2的適合性測(cè)驗(yàn),適合性測(cè)驗(yàn)含義:比較實(shí)驗(yàn)數(shù)據(jù)與理論假設(shè)是否符合的測(cè)驗(yàn)。說(shuō)明:當(dāng)自由度為1時(shí),必須進(jìn)行連續(xù)性矯正,矯正方法是用觀察次數(shù)O與理論次數(shù)E的差數(shù)的絕對(duì)值減去0.5即可;當(dāng)自由度大于或等于2時(shí),不需要矯正。實(shí)例:大豆紫色與白花花色一對(duì)等位基因的遺傳研究,在F2代獲得紫花和白花分別208和81株。問(wèn)這一資料的實(shí)際觀察數(shù)據(jù)是否符合3:1的理論數(shù)值( α=0.05

38、)。分析:第一步, H0:觀察次數(shù)與理論次數(shù)相符合,HA:不符合;第二步,α=0.05第三步, 計(jì)算χ2=∑ (︱ O-E︱-0.5)2/E=1.256< χ2α=3.84第四步, 說(shuō)明觀察次數(shù)與理論次數(shù)符合。,(二)k≥3的適合性測(cè)驗(yàn),對(duì)于劃分為兩組以上(k≥3)的資料,自由度大于或等于2時(shí),計(jì)算χ2值不需要矯正。實(shí)例:孟德?tīng)栐谄渲耐愣闺s交試驗(yàn)中,用結(jié)黃色圓形種子與結(jié)綠色皺形種子的純種豌豆作為親本進(jìn)行雜交.將F1代進(jìn)行自

39、交,得到F2代共556株豌豆,發(fā)現(xiàn)其中有四種類型植株:結(jié)黃色圓形種子的315株,結(jié)黃色皺形種子的101株,結(jié)綠色圓形種子的108株,結(jié)綠色皺形種子的32株.試問(wèn)這些植株是否符合孟德?tīng)査岢龅牡睦碚摫壤é?0.05)?,實(shí)例解答,第一步 : H0:觀察次數(shù)與理論次數(shù)相符合,HA:不符合第二步: α=0.05第三步 計(jì)算χ2=∑(O-E)2/E 第四步:查附表得 ,故在0.05水

40、平上應(yīng)接受H0,即試驗(yàn)結(jié)果是符合的理論比例的。,,,,三、 獨(dú)立性測(cè)驗(yàn),皮爾遜檢驗(yàn)是計(jì)數(shù)資料差異顯著性檢驗(yàn)的很有力的工具。上面討論的符合性檢驗(yàn)就是常對(duì)計(jì)數(shù)資料進(jìn)行的。但有時(shí)科學(xué)假設(shè)的“理論值”并不預(yù)先確定,而需要從實(shí)際所取得的資料中去推算得到。在這種情況下進(jìn)行的皮爾遜檢驗(yàn)就實(shí)質(zhì)而言,常常是為了判斷兩組或多組資料是否相互關(guān)聯(lián)(成比例)的問(wèn)題,因此稱為獨(dú)立性檢驗(yàn),亦稱為列聯(lián)表分析 。,(一)2×2相依表的獨(dú)立性測(cè)驗(yàn),實(shí)例:下表展示

41、了5735個(gè)因結(jié)核病死亡的牛所組成的樣本.試檢驗(yàn)假設(shè)H0:造成病牛死亡的結(jié)核類型與性別無(wú)關(guān)(α=0.05)。,(一)2×2相依表的獨(dú)立性測(cè)驗(yàn),假定H0成立,則意味著兩類結(jié)核病的死亡牛數(shù)的比例不因牛的性別而異 。由α=0.05 ,查附表得χ2c0=74.166> χ2α=3.84,故應(yīng)否定H0,即死于各種類型結(jié)核的牛的公母比例是不同的。如列于因呼吸系統(tǒng)結(jié)核的公牛比例數(shù),顯著不同于母牛的比例數(shù)。,,,(二)2×

42、c相依表的獨(dú)立性測(cè)驗(yàn),2×c表是指橫行分為兩組,而縱行分為c≥3組的相依表資料。在作獨(dú)立性測(cè)驗(yàn)時(shí),其自由度為(2-1)(c-1) 。由于c≥3,故計(jì)算χ2值不需要矯正。,(三)r×c相依表的獨(dú)立性測(cè)驗(yàn),含義: r×c表是指橫行分為r組,而縱行分為c組,且r≥3,c≥3,故計(jì)算χ2值不需要矯正。實(shí)例分析: 下表為不同灌溉方式下水稻葉片衰老情況的調(diào)查資料,試檢驗(yàn)稻葉衰老情況與灌溉方式無(wú)關(guān)( α=0.05

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論