版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、區(qū)間估計和假設(shè)檢驗,趙耐青復(fù)旦大學(xué)衛(wèi)生統(tǒng)計教研室,2,內(nèi)容,3,統(tǒng)計推斷,點值估計 參數(shù)估計 區(qū)間估計統(tǒng)計推斷 假設(shè)檢驗:均數(shù)間的比較 比例、率的比較
2、 ……,,,4,點估計和區(qū)間估計,參數(shù)估計可以分為點估計和區(qū)間估計點估計就是估計某個參數(shù)為某個數(shù)值(如樣本均數(shù),樣本率等)由于隨機抽樣存在抽樣誤差,由于點估計無法評價抽樣誤差的大小,而區(qū)間估計可以在95%可信度的尺度上估計參數(shù)的范圍,范圍越小,說明參數(shù)估計的抽樣誤差就越小。,5,總體均數(shù)的區(qū)間估計,假定資料 近似服從正態(tài)分布
3、 。對于隨機抽樣而言,計算統(tǒng)計量 因此基于隨機抽樣而言和 成立的概率為0.95前提下總體均數(shù)的區(qū)間估計 這個區(qū)間稱為總體均數(shù)的95%可信區(qū)間,總體均數(shù)的區(qū)間估計,總體均數(shù)的區(qū)間估計,總體均數(shù)的區(qū)間估計,總體均數(shù)的區(qū)間估計,總體均數(shù)的區(qū)間估計,總體
4、均數(shù)的區(qū)間估計,總體均數(shù)的區(qū)間估計,6,總體均數(shù)的95%可信區(qū)間舉例,例如:在某地區(qū)7歲男孩的人群中隨機抽樣,抽取200人,測量其身高,得到樣本均數(shù)為121cm,樣本標(biāo)準(zhǔn)差為5.4cm,估計該地區(qū)7歲男孩人群的平均身高在什么范圍內(nèi)。,7,(1-?)?100%可信區(qū)間及其意義,更一般而言,可以計算(1-?) ?100%可信區(qū)間,稱(1-?)為可信度??尚哦鹊囊饬x:在同一正態(tài)總體中隨機抽100個樣本,每個樣本可以計算一個95%可信區(qū)
5、間,平均有95個可信區(qū)間包含該總體的總體均數(shù)。,8,(1-?)?100%可信區(qū)間及其意義,可信度1-?越大,計算可信區(qū)間包含總體均數(shù)的正確率就越高,但可信區(qū)間的寬度就越大,也就是估計總體均數(shù)的精度就越差。一般而言,95%可信區(qū)間是兼顧了正確性和估計精度,對于特殊情況,可以計算90%可信區(qū)間或99%可信區(qū)間。對于隨機抽樣前而言,隨機抽取一個樣本量為n的樣本,計算95%可信區(qū)間,則該區(qū)間將包含總體均數(shù)的概率為95%,不包含其總體均數(shù)的概
6、率為0.05,這是一個小概率事件,對于一次隨機抽樣而言,一般是不會發(fā)生的,所以95%可信區(qū)間一般被認為就是總體均數(shù)的范圍。,9,假設(shè)檢驗(hypothesis testing),樣本均數(shù)與總體均數(shù)不等或兩樣本均數(shù)不等,有兩種可能: 由抽樣誤差所致 兩者來自不同的總體,假設(shè)檢驗是用來判斷樣本與樣本,樣本與總體的差異是由抽樣誤差引起還是本質(zhì)差別造成的統(tǒng)計推斷方法,10,,,總體μ,隨機抽樣,不是抽樣誤差?即:???0?,樣本
7、,,總體μ0,?=?0?即:抽樣誤差?,假設(shè)檢驗問題,,,總體,總體,總體,總體μ0,,,總體,不是抽樣誤差?即:???0?,總體μ0,,,總體,11,,,總體2?2,,,樣本2,隨機抽樣,樣本均數(shù)不等的原因統(tǒng)計推斷,抽樣誤差即:?1=?2 ?,,樣本1,,假設(shè)檢驗問題,總體1 ?1,不是抽樣誤差即:?1??2 ?,12,假設(shè)檢驗一般思想,小概率思想是指小概率事件(P<0.01或P<0.05)在一次試
8、驗中基本上不會發(fā)生。假設(shè)檢驗的反證法思想:先根據(jù)檢驗假設(shè)H0,建立適當(dāng)?shù)慕y(tǒng)計量,確定假設(shè)H0成立情況下服從某個概率分布,定一個范圍。H0成立時,統(tǒng)計量進入這個范圍,是一個小概率事件(P?0.05或更小),H0不成立時,統(tǒng)計量進入這個范圍的概率較大。如果實際的抽樣樣本統(tǒng)計量進入這個范圍,對H0成立情況下是一個小概率事件,一般不會發(fā)生,由此推斷假設(shè)H0不成立。這就是小概率反證法思想。,13,例如:拋硬幣,通常假設(shè): 原假設(shè)H0:正反
9、面出現(xiàn)的機會均等備擇假設(shè)H1:正反面出現(xiàn)機會不均等。如果拋20次只有1次是正面的,你就有理由懷疑原來假設(shè)“正反面出現(xiàn)的機會均等”是錯的(因為H0為真時出現(xiàn)這種情況的概率太小了,而H1為真時,出現(xiàn)這種情況的概率較大)。,假設(shè)檢驗基本思想,14,假設(shè)檢驗的基本步驟,第一步:提出檢驗假設(shè)(又稱無效假設(shè)(原假設(shè))null hypothesis, H0)和備擇假設(shè)(alternative hypothesis, H1)。預(yù)先設(shè)定
10、的檢驗水準(zhǔn)(size of test )α為0.05。選擇單雙側(cè)檢驗,H0:假設(shè)兩總體均數(shù)相等,即樣本與總體或樣本與樣本間的差異是由抽樣誤差引起的。,H1:假設(shè)兩總體均數(shù)不相等,即兩樣本與總體或樣本與樣本間存在本質(zhì)差異。,15,第二步:選定統(tǒng)計方法,計算出統(tǒng)計量的大小。根據(jù)資料的類型和特點,可選用t檢驗,則計算t值或其他檢驗方法:秩和檢驗和卡方檢驗等。,假設(shè)檢驗的基本步驟,16,第三步:根據(jù)?和統(tǒng)計量在原假設(shè)成立的分布情況
11、把統(tǒng)計量可能的取值范圍分為拒絕范圍和不拒絕范圍根據(jù)統(tǒng)計量計算值位于拒絕范圍內(nèi)還是非拒絕范圍內(nèi)進行統(tǒng)計推斷,也可以根據(jù)統(tǒng)計量取值的大小及其分布確定檢驗假設(shè)成立的可能性P的大小并判斷結(jié)果。,假設(shè)檢驗的基本步驟,p值指:在由H0所規(guī)定的總體中做隨機抽樣時,獲得等于及大于(或等于及小于)現(xiàn)有統(tǒng)計量的概率,17,t檢驗對資料的要求,t檢驗的應(yīng)用條件: 樣本來自正態(tài)總體兩樣本均數(shù)比較時還要求兩個總體方差相等,18,樣本均數(shù)與總體均數(shù)比較,樣
12、本均數(shù)與總體均數(shù)比較的t檢驗實際上是推斷該樣本來自的總體均數(shù)µ與已知的某一總體均數(shù)µ0(常為理論值或標(biāo)準(zhǔn)值) 有無差別。在未知總體中進行抽樣,用樣本均數(shù)與已知總體均數(shù)比較中,需要建立一個檢驗統(tǒng)計量,根據(jù)樣本是否屬于已知總體,該檢驗統(tǒng)計量的分布也不同,由此作出相應(yīng)的統(tǒng)計推斷。,19,樣本均數(shù)與總體均數(shù)比較舉例說明,例:研究目的:山區(qū)健康男性的脈搏均數(shù)是否大于城市成年男性。根據(jù)大量調(diào)查,已知城市健康成年男性的脈搏均數(shù)
13、為72次/分,某醫(yī)生在一山區(qū)隨即抽查了25名健康男性,求得其脈搏均數(shù)為76.2次/分,標(biāo)準(zhǔn)差為6.0次/分,問:是否能據(jù)此認為該山區(qū)成年男性的脈搏均數(shù)高于一般成年男性?,20,,樣本均數(shù)與總體均數(shù)比較,21,樣本均數(shù)與總體均數(shù)比較,上述樣本均數(shù)與總體均數(shù)不等既可能是抽樣誤差所致,也有可能真是環(huán)境差異的影響,做假設(shè)檢驗。 因為σ未知,根據(jù)研究目的:山區(qū)健康男性的脈搏均數(shù)是否大于城市男性,可用t檢驗的單側(cè)檢驗,檢驗過程如下:
14、60;1. 建立假設(shè) H0:µ=µ0 (本例µ0=72次/分), H1:µ≠µ0 2. 設(shè)置檢驗水準(zhǔn)α為0.05。,22,檢驗統(tǒng)計量,2. 設(shè)樣本所在總體為 樣本為 則,檢驗統(tǒng)計量分布情況和假設(shè)檢驗基本思想,23,陰影面積為檢驗統(tǒng)計量超出界值 的概率,H0為真時,t檢驗統(tǒng)計量服從自由度為n-1的t分布,檢驗統(tǒng)計量|t|大于界
15、值t?/2的概率為?,H1為真時,t檢驗統(tǒng)計量|t|大于界值t?/2的概率為1-?(較大或很大),24,樣本均數(shù)與總體均數(shù)比較,2. 計算統(tǒng)計量進行樣本均數(shù)與總體均數(shù)比較的t檢驗,計算t值,25,樣本均數(shù)與總體均數(shù)比較,3.確定臨界值,判斷是否應(yīng)該拒絕 當(dāng)H0:µ=µ0=72次/分為真時,在大多數(shù)情況下, 應(yīng)該在72附近,因此 應(yīng)該在0附近隨機擺動。
16、 當(dāng)H1:µ>µ0=72為真,在大多數(shù)情況下, 應(yīng)該遠離72, 應(yīng)該比較大?!∽⒁猓篨的總體均數(shù)不一定為72,只有H0為真時,X的總體均數(shù)為72,,26,樣本均數(shù)與總體均數(shù)比較,可以證明:當(dāng)H0為真時,檢驗統(tǒng)計量服從自由度為24 的t分布(即:df=24) ,查t分布表,臨界值t0.025=2.
17、064,檢驗統(tǒng)計量t=3.5>2.064是小概率事件,對于一次隨機抽樣而言,一般是不會發(fā)生的,因此拒絕H0,并且可以認為該山區(qū)成年男性的脈搏均數(shù)高于一般成年男性。,27,定義P值和應(yīng)用,以下以單側(cè)檢驗為例:即:在H0為真的情況下,檢驗統(tǒng)計量大于樣本計算的統(tǒng)計量數(shù)值的概率。也就是P值=樣本統(tǒng)計量數(shù)值開始的尾部面積(示意見圖)。意義:如果t檢驗統(tǒng)計量樣本值t=t0.05,則P= t0.05尾部的面積,故P=0.05。,P值=P(
18、檢驗統(tǒng)計量>檢驗統(tǒng)計量樣本值|H0),28,定義P值和應(yīng)用,如果檢驗統(tǒng)計量樣本值t>t0.05(u值比U0.05 更右側(cè)),則P=t尾部的面積t0.05尾部的面積,則P>0.05。 綜合上述,P>? ?檢驗統(tǒng)計量值臨界值,拒絕H0。,29,P值示意圖,在實際研究中,只需計算P值并判斷是否P< ? 決定是否拒絕H0。,,30,假設(shè)檢驗的基本步驟,若P值小于預(yù)先設(shè)定的檢驗水準(zhǔn)α ,則H0成立的可能性小,
19、即拒絕H0 。若P值不小于預(yù)先設(shè)定的檢驗水準(zhǔn)α ,則H0成立的可能性還不小,還不能拒絕H0 。P值的大小一般可通過查閱相應(yīng)的界值表得到。,31,定義P值和應(yīng)用,確定概率P,作出判斷以自由度v=n-1查t界值表,0.025<P<0.05拒絕H0,接受H1,可認為該山區(qū)成年健康男性的脈搏均數(shù)高于城市成年健康男性。,32,單側(cè)t檢驗,H0:?=?0 H1:?>?1 ?=0.05計算t
20、檢驗統(tǒng)計量查t檢驗的單側(cè)界值 ,如果檢驗統(tǒng)計量則拒絕H0,反之不能拒絕H0。單側(cè)的P值=t分布中大于t的右側(cè)尾部面積,33,兩類錯誤,34,兩類錯誤示意圖,,35,檢驗效能,,H1是真的,實際拒絕H0的概率= 1-? 稱為Power,又稱為檢驗效能,36,進行假設(shè)檢驗應(yīng)注意的問題,做假設(shè)檢驗之前,應(yīng)注意資料本身是否有可比性。當(dāng)差別有統(tǒng)計學(xué)意義時應(yīng)注意這樣的差別在實際應(yīng)用中有無意義。根據(jù)資料類型和
21、特點選用正確的假設(shè)檢驗方法。根據(jù)專業(yè)及經(jīng)驗確定是選用單側(cè)檢驗還是雙側(cè)檢驗。,37,進行假設(shè)檢驗應(yīng)注意的問題,當(dāng)檢驗結(jié)果為拒絕無效假設(shè)時,應(yīng)注意有發(fā)生I類錯誤的可能性,即錯誤地拒絕了本身成立的H0,發(fā)生這種錯誤的概率預(yù)先是知道的,即檢驗水準(zhǔn)那么大;當(dāng)檢驗結(jié)果為不拒絕無效假設(shè)時,應(yīng)注意有發(fā)生II類錯誤的可能性,即仍有可能錯誤地接受了本身就不成立的H0,發(fā)生這種錯誤的可能性預(yù)先是不知道的,但與樣本含量和I類錯誤的大小有關(guān)系。當(dāng)?shù)谝活愬e誤
22、?增大時,第二類錯誤減小。,38,進行假設(shè)檢驗應(yīng)注意的問題,判斷結(jié)論時不能絕對化,應(yīng)注意無論接受或拒絕檢驗假設(shè),都有判斷錯誤的可能性。 報告結(jié)論時是應(yīng)注意說明所用的統(tǒng)計量,檢驗的單雙側(cè)及P值的確切范圍。,39,進行假設(shè)檢驗應(yīng)注意的問題,t檢驗和u檢驗就是統(tǒng)計量為t,u的假設(shè)檢驗,兩者均是常見的假設(shè)檢驗方法。當(dāng)樣本含量n較大時,樣本均數(shù)符合正態(tài)分布,故可用u檢驗進行分析。當(dāng)樣本含量n小時,若觀察值x符合正態(tài)分布,則用t檢
23、驗(因此時樣本均數(shù)符合t分布)當(dāng)x為未知分布時應(yīng)采用秩和檢驗。,40,可信區(qū)間與假設(shè)檢驗的關(guān)系,不同: 可信區(qū)間——量的問題 假設(shè)檢驗——質(zhì)的問題,可信區(qū)間亦可用于回答假設(shè)檢驗的問題,可信區(qū)間比假設(shè)檢驗提供更多的信息可以回答有無統(tǒng)計學(xué)意義,還可回答有無實際意義,41,可信區(qū)間與假設(shè)檢驗的關(guān)系,42,STATA命令,正態(tài)分布總體均數(shù)的95%可信區(qū)間命令為:cii 樣本量 樣本均數(shù) 樣本標(biāo)準(zhǔn)差例4.1 c
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 重點區(qū)間估計假設(shè)檢驗復(fù)習(xí)建議難點
- 第6章 總體率的區(qū)間估計和假設(shè)檢驗
- 參數(shù)估計和假設(shè)檢驗
- 參數(shù)估計和假設(shè)檢驗
- Pareto分布中尺度參數(shù)的區(qū)間估計和假設(shè)檢驗.pdf
- 總體率的區(qū)間估計與假設(shè)檢驗ppt課件
- 參數(shù)估計和假設(shè)檢驗案例
- 第十章 雙樣本假設(shè)檢驗及區(qū)間估計
- 置信區(qū)間與假設(shè)檢驗
- 參數(shù)估計與假設(shè)檢驗
- 參數(shù)估計和假設(shè)檢驗習(xí)題解答
- 第5章 參數(shù)估計和假設(shè)檢驗
- 兩總體最優(yōu)夏普指數(shù)差異的Bootstrap區(qū)間估計及假設(shè)檢驗.pdf
- 假設(shè)檢驗48924
- 《醫(yī)學(xué)假設(shè)檢驗》
- 假設(shè)檢驗t檢驗
- 假設(shè)檢驗匯總
- 假設(shè)檢驗亦稱
- 假設(shè)檢驗的思想和原理
- 假設(shè)檢驗-例題講解
評論
0/150
提交評論