版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、,,概率論與數(shù)理統(tǒng)計(jì)第十五講,主講教師:柴中林副教授,中國計(jì)量學(xué)院理學(xué)院,數(shù)理統(tǒng)計(jì)學(xué)是一門應(yīng)用性很強(qiáng)的學(xué)科。它研究怎樣以有效的方式收集、 整理和分析帶有隨機(jī)性的數(shù)據(jù),以便對所考察的問題作出正確的推斷和預(yù)測,為采取正確的決策和行動提供依據(jù)和建議。,數(shù)理統(tǒng)計(jì)不同于一般的資料統(tǒng)計(jì),它更側(cè)重于應(yīng)用隨機(jī)現(xiàn)象本身的規(guī)律性進(jìn)行資料的收集、整理和分析。,第六章 樣本與統(tǒng)計(jì)量,§6.1 引言,由于大量隨機(jī)現(xiàn)象必然呈現(xiàn)出其規(guī)律性,因而從理論
2、上講,只要對隨機(jī)現(xiàn)象進(jìn)行足夠多次的觀察,隨機(jī)現(xiàn)象的規(guī)律性就一定能夠清楚地呈現(xiàn)出來。,但是,客觀上只允許我們對隨機(jī)現(xiàn)象進(jìn)行次數(shù)不多的觀察或試驗(yàn),也就是說:我們獲得的只能是局部的或有限的觀察資料。,數(shù)理統(tǒng)計(jì)的任務(wù)就是研究怎樣有效地收集、整理和分析所獲得的有限資料,并對所研究的問題盡可能地給出精確而可靠的推斷。,現(xiàn)實(shí)世界中存在著形形色色的數(shù)據(jù),分析這些數(shù)據(jù)需要多種多樣的方法。,因此,數(shù)理統(tǒng)計(jì)中的方法和支持這些方法的相應(yīng)理論是相當(dāng)豐富的。概括起
3、來可以歸納成兩大類。 參數(shù)估計(jì): 根據(jù)數(shù)據(jù),對分布中的未知參數(shù) 進(jìn)行估計(jì); 假設(shè)檢驗(yàn): 根據(jù)數(shù)據(jù),對分布的未知參數(shù)的 某種假設(shè)進(jìn)行檢驗(yàn)。 參數(shù)估計(jì)與假設(shè)檢驗(yàn)構(gòu)成了統(tǒng)計(jì)推斷的兩種基本形式,這兩種推斷滲透到了數(shù)理統(tǒng)計(jì)的每個分支。,§6.2 總體與樣本,在數(shù)理統(tǒng)計(jì)中,稱研究問題所涉及對象的全體為總體,總體中的每個成員為個體。 例如: 研究某工廠生產(chǎn)的某
4、種產(chǎn)品的廢品率,則這種產(chǎn)品的全體就是總體,而每件產(chǎn)品都是一個個體。,6.2.1 總體、個體與樣本,實(shí)際上,我們真正關(guān)心的并不一定是總體或個體本身,而真正關(guān)心的是總體或個體的某項(xiàng)數(shù)量指標(biāo)。 如:某電子產(chǎn)品的使用壽命,某天的最高氣溫,加工出來的某零件的長度等數(shù)量指標(biāo)。因此,有時也將總體理解為那些研究對象的某項(xiàng)數(shù)量指標(biāo)的全體。,為評價某種產(chǎn)品質(zhì)量的好壞,通常的做法是:從全部產(chǎn)品中隨機(jī)(任意)地抽取一些樣品(部分個體)進(jìn)行觀測(檢測),
5、統(tǒng)計(jì)學(xué)上稱這些樣品為一個樣本。 同樣,我們也將樣本的數(shù)量指標(biāo)稱為樣本。因此,今后當(dāng)我們說到總體及樣本時,既指研究對象又指它們的某項(xiàng)數(shù)量指標(biāo)。,例1:研究某地區(qū) N 個農(nóng)戶的年收人。 在這里,總體既指這 N 個農(nóng)戶,又指我們所關(guān)心的 N個農(nóng)戶的數(shù)量指標(biāo)──他們的年收入( N 個數(shù)字)。 如果從這 N 個農(nóng)戶中隨機(jī)地抽出 n 個農(nóng)戶作為調(diào)查對象,那么,這 n 個農(nóng)戶以及他們的數(shù)量指標(biāo)──年收入( n個數(shù)字)就是樣本
6、。,注意:上例中的總體是直觀的,看得見、摸得著的。但是,客觀情況并非總是這樣。,例2:用一把尺子測量一件物體的長度。 假定 n 次測量值分別為X1,X2 ,…,Xn。顯然,在該問題中,我們把測量值X1,X2 ,…,Xn看成樣本。但總體是什么呢?,事實(shí)上,這里沒有一個現(xiàn)實(shí)存在的個體的集合可以作為上述問題的總體??墒?,我們可以這樣考慮,既然 n 個測量值 X1,X2,…,Xn 是樣本,那么,總體就應(yīng)該理解為一切所有可能的測量值的全體
7、。,又如:為研究某種安眠藥的藥效,讓 n 個病人同時服用這種藥,記錄服藥者各自服藥后的睡眠時間比未服藥時增加睡眠的小時數(shù) X1,X2,…,Xn,則這些數(shù)字就是樣本。 那么,什么是總體呢? 設(shè)想讓某個地區(qū)(或某國家,甚至全世界)所有患失眠癥的病人都服用此藥,則他們所增加睡眠的小時數(shù)之全體就是研究問題的總體。,對一個總體,如果用X表示其數(shù)量指標(biāo),那么,X的值對不同的個體就取不同的值。因此,如果我們隨機(jī)
8、地抽取個體,則X的值也就隨著抽取個體的不同而不同。 所以,X是一個隨機(jī)變量! 既然總體是隨機(jī)變量X,自然就有其概率分布。我們把X的分布稱為總體分布。 總體的特性是由總體分布來刻畫的。因此,常把總體和總體分布視為同義語。.,6.2.2 總體分布,例 3 (例 l 續(xù)):在例 l中,若農(nóng)戶年收入以萬元計(jì),假定 N戶的收入X只取以下各值: 0.5, 0.8, l.0, 1.2和1.5。取上述值的戶數(shù)分別n1, n2,
9、n3, n4和n5 (n1+n2+n3+n4+n5=N)。則X為離散型分布,分布律為:,例4 ( 例2續(xù) ):在例2中,假定物體真實(shí)長度為?(未知)。一般說來,測量值X就是總體,取? 附近值的概率要大一些,而離? 越遠(yuǎn)的值被取到的概率就越小。 如果測量過程沒有系統(tǒng)性誤差,則X取大于? 和小于? 的概率也會相等。 在這種情況下,人們往往認(rèn)為X 服從均值為?,方差為?2 的正態(tài)分布。?2反映了測量的精度。于是,總體X的分布
10、為 N(?,?2)。,說明:這里有一個問題,即物體長度的測量值總是在其真值 ? 的附近,它不可能取負(fù)值。 而正態(tài)分布取值在(-∞,∞)上。那么,為什么可以認(rèn)為測量值X服從正態(tài)分布呢? 回答這個問題,有如下兩方面的理由。,(1).在前面講過,對于X~N(?,?2), P{?-3?<X<?+3?}=0.9974.即 X 落在區(qū)間(?-3?,?+3?)之外的概率不超過 0.003, 這個概率非常
11、小。X 落在(?-4?,?+4?)之外的概率就更小了。,例如:假定物體長度? =10厘米,測量誤差為0.01厘米,則?2=0.012。 這時,(?-3?,?+3?)=(9.97,10.03)。于是,測量值落在這個區(qū)間之外的概率最多只有0.003,可忽略不計(jì)。 可見,用正態(tài)分布 N(10,0.012)去描述測量值X是適當(dāng)?shù)?。完全可認(rèn)為:X 根本就不可能取到負(fù)值;,如若不然, 就需要用一個定義在有限區(qū)間(a,b)取值的隨機(jī)變
12、量來描述測量值X。那么, a和b到底取什么值呢?測量者事先很難確定。 再退一步,即使能夠確定出a和b,卻仍很難找出一個定義在 (a,b) 上的非均勻分布用來恰當(dāng)?shù)孛枋鰷y量值。與其這樣,還不如干脆就把取值區(qū)間放大到(-∞,∞),并用正態(tài)分布來描述測量值。這樣,既簡化了問題,又不致引起較大的誤差。,(2). 另外,正態(tài)分布取值范圍是(-∞,∞),這樣還可以解決規(guī)定測量值取值范圍上的困難。,● 如果總體所包含的個體數(shù)量是有限的, 則
13、 稱該總體為有限總體。有限總體的分布顯 然是離散型的,如例3?!?如果總體所包含的個體數(shù)量是無限的,則 稱該總體為無限總體。無限總體的分布可 以是連續(xù)型的,如例4;也可是離散型的。,說明:在數(shù)理統(tǒng)計(jì)中,研究有限總體比較困難。因?yàn)槠浞植际请x散型的,且分布律與總體中所含個體數(shù)量有關(guān)系。,通常在總體所含個體數(shù)量比較大時,將其近似地視為無限總體,并用連續(xù)型分布逼近總體的分布,這樣便于進(jìn)一步地做統(tǒng)計(jì)分析。,例5:研究
14、某大城市年齡在1歲到10歲之間兒童的身高。 顯然,不管城市規(guī)模多大,這個年齡段的兒童數(shù)量總是有限的。因此,該總體X只能是有限總體。總體分布只能是離散型分布。,然而,為便于處理問題,我們將有限總體近似地看成一個無限總體,并用正態(tài)分布來逼近這個總體的分布。 當(dāng)城市比較大,兒童數(shù)量比較多時,這種逼近所帶來的誤差,從應(yīng)用觀點(diǎn)來看,可以忽略不計(jì)。,樣本的二重性,● 假設(shè) X1, X2, …, Xn 是總體X中的樣本,在一 次具
15、體的觀測或試驗(yàn)中,它們是一批測量值, 是已經(jīng)取到的一組數(shù)。這就是說,樣本具有 數(shù)的屬性。.,● 由于在具體試驗(yàn)或觀測中,受各種隨機(jī)因素 的影響,在不同試驗(yàn)或觀測中,樣本取值可 能不同。因此,當(dāng)脫離特定的具體試驗(yàn)或觀 測時,我們并不知道樣本 X1,X2,…,Xn 的具 體取值到底是多少。因此,可將樣本看成隨 機(jī)變量。故,樣本又具有隨機(jī)變量的屬性。.,樣本X1,X2,…,Xn既被看成數(shù)值,又被看成隨機(jī)變量
16、,這就是所謂的樣本的二重性。,例 6 (例2續(xù)):在前面測量物體長度的例子中,如果我們在完全相同的條件下,獨(dú)立地測量了n 次,把這 n 次測量結(jié)果,即樣本記為 X1,X2,…,Xn .,隨機(jī)樣本,那么,我們就認(rèn)為:這些樣本相互獨(dú)立,且有相同的分布;其分布與總體分布 N(?, ?2)相同。,將上述結(jié)論推廣到一般的分布:如果在相同條件下對總體 X 進(jìn)行 n 次重復(fù)、獨(dú)立觀測,就可以認(rèn)為所獲得的樣本X1,X2,…,Xn是 n 個獨(dú)立且與總
17、體 X 有同樣分布的隨機(jī)變量。,在統(tǒng)計(jì)文獻(xiàn)中,通常稱相互獨(dú)立且有相同分布的樣本為隨機(jī)樣本或簡單樣本(重復(fù)抽樣即是。對不重復(fù)抽樣,當(dāng)樣本容量不及總體的1/10時可以近似看作重復(fù)抽樣), n 為樣本大小或樣本容量。,既然樣本 X1,X2,…,Xn 被看作隨機(jī)向量,自然需要研究其聯(lián)合分布。,6.2.3 樣本分布,假設(shè)總體 X 具有概率密度函數(shù) f (x),因樣本X1,X2,…,Xn獨(dú)立同分布于 X,于是,樣本的聯(lián)合概率密度函數(shù)為,例7:
18、假設(shè)某大城市居民的收入 X 服從正態(tài)分布N(?,?2), 概率密度為,現(xiàn)從總體 X 中隨機(jī)抽取樣本 X1,…,Xn ,因其獨(dú)立同分布于總體 X,即: Xi ~ N(?,?2), i=1,2,…,n.于是,樣本X1,X2,…,Xn 的聯(lián)合概率密度為,由樣本推斷總體的某些情況時,需要對樣本進(jìn)行“加工”,構(gòu)造出若干個樣本的已知 (確定)的函數(shù),其作用是把樣本中所含的某一方面的信息集中或提煉起來。,6.3.1 統(tǒng)
19、計(jì)量,這種不含任何未知參數(shù)的樣本的函數(shù)稱為統(tǒng)計(jì)量。它是完全由樣本所決定的量。,§6.3 統(tǒng)計(jì)量,幾個常見統(tǒng)計(jì)量,樣本均值,樣本方差,反映總體均值的信息,反映總體方差的信息,樣本標(biāo)準(zhǔn)差,樣本 k 階原點(diǎn)矩,樣本 k 階中心矩,k=1,2, …,反映總體k 階矩的信息,反映總體k 階中心矩的信息,6.3.2 抽樣分布,統(tǒng)計(jì)量既然依賴于樣本,而后者又是隨機(jī)變量,故統(tǒng)計(jì)量也是隨機(jī)變量,有一定的分布,這個分布稱為統(tǒng)計(jì)量的抽樣分
20、布。,定理1:設(shè) X1,X2,?,Xn是來自均值為? ,方差為 ?2 的總體(未必正態(tài)分布)的樣本,則當(dāng) n 充分大時, 近似地有,抽樣分布定理,證明:因X1,X2,…,Xn是來自均值為? ,方差為?2 的總體的樣本。故 X1,X2,…,Xn 獨(dú)立同分布, 且 E(X)=?,Var(X)=?2, i=1,2,…,n。據(jù)中心極限定理,有,即對充分大的 n,近似地有,● 樣本均值分布函數(shù)的近似計(jì)算,定理應(yīng)用,總有,● 樣本均值與 ? 的
21、偏差在一定范圍內(nèi)的概率的 近似計(jì)算,從上式可以看出:對給定的?2和給定的 c>0,當(dāng)樣本大小 n 增大時,上面的概率也隨之增大;n 趨于無窮時,上式趨近于 1。,任給c >0,總有,例1:用機(jī)器向瓶子里灌裝液體洗滌劑,規(guī)定每瓶裝 ? 毫升。但實(shí)際灌裝量總有一定波動。假定灌裝量的方差 ?2=1,如果每箱裝這樣的洗滌劑 25 瓶。求這 25 瓶洗凈劑的平均灌裝量與標(biāo)定值 ? 相差不超過0.3毫升的概率;又如果每箱裝50
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- [學(xué)習(xí)]概率論與數(shù)理統(tǒng)計(jì)柴中林第4講
- [學(xué)習(xí)]概率論與數(shù)理統(tǒng)計(jì)柴中林第20講
- [學(xué)習(xí)]概率論與數(shù)理統(tǒng)計(jì)柴中林第2講
- [學(xué)習(xí)]概率論與數(shù)理統(tǒng)計(jì)柴中林第6講
- [學(xué)習(xí)]概率論與數(shù)理統(tǒng)計(jì)柴中林第16講
- [學(xué)習(xí)]概率論與數(shù)理統(tǒng)計(jì)柴中林第8講
- [學(xué)習(xí)]概率論與數(shù)理統(tǒng)計(jì)柴中林第14講
- [學(xué)習(xí)]概率論與數(shù)理統(tǒng)計(jì)柴中林第21講
- [學(xué)習(xí)]概率論與數(shù)理統(tǒng)計(jì)柴中林第19講
- [學(xué)習(xí)]概率論與數(shù)理統(tǒng)計(jì)柴中林第9講
- [學(xué)習(xí)]概率論與數(shù)理統(tǒng)計(jì)柴中林第5講
- [學(xué)習(xí)]概率論與數(shù)理統(tǒng)計(jì)柴中林第17講
- [學(xué)習(xí)]概率論與數(shù)理統(tǒng)計(jì)柴中林第7講
- [學(xué)習(xí)]概率論與數(shù)理統(tǒng)計(jì)柴中林第12講
- [學(xué)習(xí)]概率論與數(shù)理統(tǒng)計(jì)柴中林第1講
- [學(xué)習(xí)]概率論與數(shù)理統(tǒng)計(jì)柴中林第11講
- [學(xué)習(xí)]概率論與數(shù)理統(tǒng)計(jì)柴中林第3講
- [學(xué)習(xí)]概率論與數(shù)理統(tǒng)計(jì)柴中林第18講
- [學(xué)習(xí)]概率論與數(shù)理統(tǒng)計(jì)柴中林復(fù)習(xí)
- 概率論與數(shù)理統(tǒng)計(jì)
評論
0/150
提交評論