版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、<p> 關(guān)于中小型銀行大數(shù)據(jù)的統(tǒng)計(jì)分析</p><p><b> 年 月</b></p><p> 學(xué) 院</p><p> 專 業(yè)*****</p><p> 班 級***</p><p> 學(xué) 號*****</p><p>
2、姓 名</p><p> 指導(dǎo)教師</p><p><b> 目錄</b></p><p><b> 前言1</b></p><p> 一、采集樣本及數(shù)據(jù)整理2</p><p> 1、數(shù)據(jù)的搜集方法及說明2</p><p> 2、
3、數(shù)據(jù)整理:給出頻數(shù)、頻率分布表及說明5</p><p> 3、畫出直方圖和折線圖并給出說明5</p><p> 4、 畫出經(jīng)驗(yàn)分布函數(shù)7</p><p> 二、假定總體服從正態(tài)分布,給出,的估計(jì)8</p><p><b> 1、矩估計(jì)法8</b></p><p> 2、極大似然
4、估計(jì)8</p><p> 三、參數(shù)區(qū)間估計(jì)10</p><p> 1、方差未知,求數(shù)學(xué)期望的置信區(qū)間10</p><p> 2、數(shù)學(xué)期望,均未知,求方差的置信區(qū)間10</p><p> 四、參數(shù)的假設(shè)檢驗(yàn)11</p><p> 1.樣本統(tǒng)計(jì)數(shù)據(jù)的t檢驗(yàn)11</p><p>
5、 2.樣本統(tǒng)計(jì)數(shù)據(jù)的檢驗(yàn)11</p><p> 五、 非參數(shù)假設(shè)檢驗(yàn)13</p><p><b> 六、結(jié)論15</b></p><p><b> 參考文獻(xiàn)16</b></p><p><b> 前言</b></p><p> 數(shù)理統(tǒng)
6、計(jì)是一門對隨機(jī)現(xiàn)象進(jìn)行有限次的觀測或試驗(yàn)的結(jié)果進(jìn)行數(shù)量研究,并依之對總體的數(shù)理規(guī)律性作出具有一定可靠性推斷的應(yīng)用數(shù)學(xué)學(xué)科。也就是說,數(shù)理統(tǒng)計(jì)學(xué)是統(tǒng)計(jì)學(xué)的數(shù)學(xué)基礎(chǔ),它是研究怎樣有效地收集、整理和分析帶有隨機(jī)性的數(shù)據(jù),以對所考察的問題作出推斷和預(yù)測,直至為采取一定的決策和行動(dòng)提供依據(jù)和建議的數(shù)學(xué)分支。近幾十年來,數(shù)理統(tǒng)計(jì)的廣泛應(yīng)用是非常引人注目的。在社會(huì)科學(xué)中,選舉人對政府意見的調(diào)查、民意測驗(yàn)、經(jīng)濟(jì)價(jià)值的評估、產(chǎn)品銷路的預(yù)測、犯罪案件的偵破
7、等,都有數(shù)理統(tǒng)計(jì)的功勞[1]。在經(jīng)濟(jì)領(lǐng)域,從某種商品未來的銷售情況預(yù)測,甚至整個(gè)國家國民經(jīng)濟(jì)狀況預(yù)測及發(fā)展計(jì)劃的制定都要用到數(shù)理統(tǒng)計(jì)知識[2]。在自然科學(xué)、軍事科學(xué)、工農(nóng)業(yè)生產(chǎn)、醫(yī)療衛(wèi)生等領(lǐng)域,哪一個(gè)門類都離不開數(shù)理統(tǒng)計(jì)。它的用處之大不勝枚舉。籠統(tǒng)地說,數(shù)理統(tǒng)計(jì)學(xué)的理論和方法,與人類活動(dòng)的各個(gè)領(lǐng)域在不同程度上都有關(guān)聯(lián)。因?yàn)楦鱾€(gè)領(lǐng)域內(nèi)的活動(dòng),都得在不同的程度上與數(shù)據(jù)打交道,都有如何收集和分析數(shù)據(jù)的問題,因此也就有數(shù)理統(tǒng)計(jì)學(xué)用武之地??梢赃@
8、么說,現(xiàn)代人的生活、科學(xué)的發(fā)展都離不開數(shù)理統(tǒng)計(jì)。從某種意義上講,數(shù)理統(tǒng)計(jì)在一個(gè)國家中的應(yīng)用標(biāo)志著這個(gè)國家的科學(xué)水平</p><p> 數(shù)理統(tǒng)計(jì)可以看做是概率論的推廣應(yīng)用,其眾多內(nèi)容都是建立在概率論基礎(chǔ)之上的[4]。但是,數(shù)理統(tǒng)計(jì)作為純數(shù)學(xué)的一個(gè)方向,如果僅僅研究數(shù)理統(tǒng)計(jì)的數(shù)學(xué)性質(zhì),就脫離了數(shù)學(xué)在科學(xué)研究中應(yīng)有的價(jià)值。正如數(shù)學(xué)以其邏輯性和嚴(yán)密性被其他學(xué)科作為有力工具運(yùn)用于分析應(yīng)用中一樣,數(shù)理統(tǒng)計(jì)也因?yàn)槠溥壿嬓院蛧?yán)
9、密性被引用到銀行的領(lǐng)域中。本文就是對這方面的應(yīng)用,通過用計(jì)算機(jī)領(lǐng)域中的信息安全技術(shù),對全國中小型銀行的大數(shù)據(jù)處理個(gè)數(shù)的統(tǒng)計(jì)。其間分別進(jìn)行了數(shù)據(jù)模型的選擇和建立,數(shù)據(jù)的采集,數(shù)據(jù)的整理,對數(shù)據(jù)進(jìn)行的統(tǒng)計(jì)推斷,給出矩法估計(jì)、極大似然估計(jì)、給出參數(shù)估計(jì)區(qū)間、給出的t檢驗(yàn)和檢驗(yàn),進(jìn)行非參數(shù)擬合優(yōu)度檢驗(yàn),從而得出相應(yīng)的結(jié)論。</p><p> 一、采集樣本及數(shù)據(jù)整理</p><p> 1、數(shù)據(jù)的
10、搜集方法及說明</p><p> 眾所周知,數(shù)據(jù)的搜集方法有直接搜集方法和間接搜集方法,直接搜集是直接向調(diào)查對象搜集反映調(diào)查單位的原始資料數(shù)據(jù)。而我采用的是間接搜集方法,也就是通過網(wǎng)絡(luò)搜集到已經(jīng)加工整理過的、能夠說明總體現(xiàn)象的數(shù)據(jù)。本文采集的是2012年5月1日中國部分中小型銀行利用信息安全技術(shù)對大數(shù)據(jù)處理個(gè)數(shù)。如表1-1所示:</p><p> 表1-1 中國部分
11、中小型銀行數(shù)據(jù)統(tǒng)計(jì)</p><p> 從表1-1中,可以非常明顯得看到各中小型銀行的大數(shù)據(jù)處理個(gè)數(shù),下面我們對各銀行做下討論與研究。</p><p> 2、數(shù)據(jù)整理:給出頻數(shù)、頻率分布表及說明</p><p> 從上面的表中看到,銀行大數(shù)據(jù)(單元:億)的樣本觀察值的最小值是湖北省孝感市商業(yè)銀行的個(gè)數(shù),最大值是位于北京市的北京銀行,取a=78,b=4418,全距
12、L=4418-78=4340,把數(shù)據(jù)分布的區(qū)間(78,4418]等分為10個(gè)子區(qū)間,等組距為,i=1,2,…10。</p><p> 通過計(jì)數(shù)求出落在各子區(qū)間的大數(shù)據(jù)個(gè)數(shù),則得頻數(shù)和頻率分布,列入表1-2。</p><p> 表1-2 大數(shù)據(jù)頻數(shù)和頻率分布表</p><p> 3、畫出直方圖和折線圖并給出說明</p&
13、gt;<p> 由于等組距,故在橫軸上截取子區(qū)間,且各子區(qū)間的寬度等于組距434,第i個(gè)小矩形的高為組頻數(shù),由此從直方圖的分布上可以大致看出大數(shù)據(jù)的分布。直方圖1-1和折線圖1-2所示。</p><p> 圖1-1 頻數(shù)-大數(shù)據(jù)子區(qū)間直方圖</p><p> 圖1-2 頻數(shù)-大數(shù)據(jù)子區(qū)間折線圖</p><p> 由圖1-1和圖1-2可見,直方圖
14、大致呈對稱形狀,可以認(rèn)為大數(shù)據(jù)近似服從正態(tài)分布,其數(shù)學(xué)期望大致在2300附近。</p><p><b> 畫出經(jīng)驗(yàn)分布函數(shù)</b></p><p> 由于依賴順序統(tǒng)計(jì)量的觀察值,所以是一個(gè)隨機(jī)變量,它的可能取值為:,,…,,1,故表示n次獨(dú)立試驗(yàn)中,事件發(fā)生的頻率。樣本X1,X2,…Xn中n個(gè)隨機(jī)變量相互獨(dú)立,導(dǎo)致事件發(fā)生的概率等價(jià)于進(jìn)行n次伯努力試驗(yàn),事件發(fā)生k
15、次的概率,即</p><p> 其中是總體X的分布函數(shù)。</p><p> 二、假定總體服從正態(tài)分布,給出,的估計(jì)</p><p><b> 1、矩估計(jì)法</b></p><p> 從總體中隨機(jī)抽取25個(gè)樣本:</p><p> 162.33, 702.22, 1233.85, 1501
16、, 1795.1, 1800, 1928.38, 2000, 2107, 2217,</p><p> 2240.77, 2247.81, 2507, 2577.56, 2627, 2668.4, 2681.5, 2699, 2926.7, </p><p> 2998.13, 3015.24, 3108.56, 3533.6, 3716, 4417.65 </p>
17、<p> 將樣本值代入,得出和的矩估計(jì)值:</p><p> 的矩估計(jì)值為 =2376.5</p><p> 的矩估計(jì)值為 =810220.1</p><p><b> 2、極大似然估計(jì)</b></p><p> 對正態(tài)總體,是二維參數(shù),設(shè)有樣本,,…,則似
18、然函數(shù)及其對數(shù)分別為</p><p> 將分別關(guān)于兩個(gè)分量求偏導(dǎo)并令其為0,即得到似然方程組</p><p> 解此方程組,可得的極大似然估計(jì)為</p><p> 將之代入第二方程,得出的極大似然估計(jì)</p><p> 所以的極大似然估計(jì)量為 </p><p> 的極大似然估計(jì)量為 </p>
19、<p> 將樣本值代入,得出,的極大似然估計(jì)值</p><p><b> =2376.5</b></p><p> ?。?10353.15</p><p><b> 三、參數(shù)區(qū)間估計(jì)</b></p><p> 1、方差未知,求數(shù)學(xué)期望的置信區(qū)間</p><p&
20、gt; 當(dāng)已知時(shí),選取樣本的函數(shù)服從標(biāo)準(zhǔn)正態(tài)分布,即</p><p> 給定置信水平0.95,使</p><p> 分位數(shù)為,上式等價(jià)于</p><p> 則的置信水平為0.95的置信區(qū)間為</p><p> 2、數(shù)學(xué)期望,均未知,求方差的置信區(qū)間</p><p><b> 選取樣本的函數(shù)為<
21、;/b></p><p> 給定置信水平0.95,使</p><p> 從分布表查出分位數(shù)為,,于是</p><p> 樣本方差為844117.9則的置信水平為0.95的置信區(qū)間為</p><p><b> 四、參數(shù)的假設(shè)檢驗(yàn)</b></p><p> 1.樣本統(tǒng)計(jì)數(shù)據(jù)的t檢驗(yàn)&l
22、t;/p><p> 假設(shè)所有銀行所處理的大數(shù)據(jù)個(gè)數(shù)都為2400億個(gè)。 </p><p> (1) 原假設(shè)和備擇假設(shè)</p><p><b> , </b></p><p> (2) 選取檢驗(yàn)統(tǒng)計(jì)量</p><p> 當(dāng)原假設(shè)為真時(shí),檢驗(yàn)統(tǒng)計(jì)量為</p><p&
23、gt;<b> (3) 確定拒絕域</b></p><p><b> 給定顯著水平,使</b></p><p> 查t分布表得臨界值為,則拒絕域?yàn)榛颉?lt;/p><p> (4) 樣本標(biāo)準(zhǔn)差為,計(jì)算檢驗(yàn)統(tǒng)計(jì)量的觀察值,</p><p><b> (5) 作判斷</b>&
24、lt;/p><p> 由于,因此接受原假設(shè)。認(rèn)為所有銀行所處理的大數(shù)據(jù)均為2400億個(gè)。</p><p> 2.樣本統(tǒng)計(jì)數(shù)據(jù)的檢驗(yàn)</p><p> (1) 原假設(shè)和備擇假設(shè)</p><p><b> , </b></p><p> (2) 選取檢驗(yàn)統(tǒng)計(jì)量</p><
25、;p> 當(dāng)原假設(shè)為真時(shí),檢驗(yàn)統(tǒng)計(jì)量為</p><p><b> (3) 確定拒絕域</b></p><p> 樣本方差為844117.9,給定顯著性水平,使</p><p> 則拒絕域?yàn)?0,10.856]或[42.980,)。</p><p> 計(jì)算檢驗(yàn)統(tǒng)計(jì)量的觀察值</p><p&
26、gt;<b> (5)作判斷 </b></p><p> 因?yàn)?,所以接受原假設(shè)。</p><p><b> 非參數(shù)假設(shè)檢驗(yàn)</b></p><p><b> 擬合優(yōu)度檢驗(yàn)</b></p><p> 頻率分布如表1-2所示,通過畫直方圖,粗略知大數(shù)據(jù)個(gè)數(shù)服從正態(tài)分布,數(shù)
27、學(xué)期望大致在2300左右。檢驗(yàn)在顯著性水平下,各銀行的大數(shù)據(jù)個(gè)數(shù)X是否服從正態(tài)分布。</p><p><b> 原假設(shè)和備擇假設(shè)為</b></p><p><b> , 不真</b></p><p> 其中,均為未知參數(shù)。,的極大似然估計(jì)值分別為</p><p> =2376.5,
28、 </p><p> 以表1-2為基礎(chǔ),原假設(shè)為真時(shí),計(jì)算隨機(jī)變量X 落在各小區(qū)間的概率。</p><p><b> …</b></p><p><b> 等價(jià)檢驗(yàn)假設(shè)</b></p><p><b> ,,…,</b></p><p> 計(jì)算
29、結(jié)果列于表5-1。</p><p> 表5-1 各區(qū)間概率</p><p> 合并后的區(qū)間個(gè)數(shù)為k=7,隨機(jī)變量分布中含有兩個(gè)未知參數(shù),因此當(dāng)原假設(shè)為真時(shí),檢驗(yàn)統(tǒng)計(jì)量為</p><p><b> 給定顯著性水平,使</b></p><p> 臨界值為,則拒絕域?yàn)?/p>
30、[9.448,)。</p><p> 檢驗(yàn)統(tǒng)計(jì)量的觀察值為</p><p> 因此,因此接受原假設(shè),可以認(rèn)為大數(shù)據(jù)個(gè)數(shù)服從正態(tài)分布N(2376.5,900.1962)。</p><p><b> 六、結(jié)論</b></p><p> 本文第一部分對全國中小型銀行的大數(shù)據(jù)處理情況分別進(jìn)行采集、數(shù)據(jù)整理,給出了頻數(shù)、頻
31、率分布表并畫出了直方圖和折線圖并給出說明,通過得到的圖可以看出期望大致在2300左右。第二部分給出,的估計(jì),包括矩估計(jì)和極大似然估計(jì),從而得到估計(jì)的期望和方差。第三部分是參數(shù)區(qū)間估計(jì),有方差未知時(shí),在置信水平為0.95時(shí)得到的數(shù)學(xué)期望的置信區(qū)間;還有數(shù)學(xué)期望,均未知,也是置信水平為0.95時(shí)所得到的方差的置信區(qū)間。第四部分是參數(shù)的假設(shè)檢驗(yàn),有樣本統(tǒng)計(jì)數(shù)據(jù)的t檢驗(yàn),通過判斷接受原假設(shè),可以認(rèn)為所有銀行所處理的大數(shù)據(jù)均為2400億個(gè)。還有樣
32、本統(tǒng)計(jì)數(shù)據(jù)的檢驗(yàn),通過分析,可以接受原假設(shè)。最后第五章是非參數(shù)假設(shè)檢驗(yàn),也就是對總體分布不作任何假設(shè),至多設(shè)總體服從連續(xù)分布,這種就是非參數(shù)假設(shè)檢驗(yàn)。這章就是針對總體分布未知,檢驗(yàn)總體是否服從正態(tài)分布,利用樣本觀察值對總體分布作出推斷[5] 。實(shí)際上是檢驗(yàn)樣本與理論分布的擬合優(yōu)度,這一節(jié)所用的就是擬合優(yōu)度檢驗(yàn),通過檢驗(yàn)得出,可以認(rèn)為樣本服從正態(tài)分布N(2376.5,900.1962)。</p><p><b
33、> 參考文獻(xiàn)</b></p><p> [1] 梁相龍.論數(shù)理統(tǒng)計(jì)在客觀現(xiàn)實(shí)中的意義與作用[J].Forum on Contemporary </p><p> Education,2011(02)</p><p> [2] 李志浩.數(shù)理統(tǒng)計(jì)與現(xiàn)代金融[B].征信,2012(4)</p><p> [3] 陸冬
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 醫(yī)藥數(shù)理統(tǒng)計(jì)學(xué)實(shí)驗(yàn)設(shè)計(jì)
- 數(shù)理統(tǒng)計(jì)學(xué)復(fù)習(xí)題
- 社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)學(xué)和數(shù)理統(tǒng)計(jì)學(xué)的關(guān)系分析
- 數(shù)理統(tǒng)計(jì)學(xué)科目大綱復(fù)試
- 數(shù)理統(tǒng)計(jì)學(xué)第五回-統(tǒng)計(jì)的推測とは?
- 大數(shù)據(jù)的統(tǒng)計(jì)分析方法
- 互聯(lián)電網(wǎng)實(shí)際運(yùn)行數(shù)據(jù)的數(shù)理統(tǒng)計(jì)分析.pdf
- 基于數(shù)理統(tǒng)計(jì)學(xué)的烏孫墓葬研究_2985.pdf
- 多元統(tǒng)計(jì)分析課程設(shè)計(jì)
- 多元統(tǒng)計(jì)分析-課程設(shè)計(jì)
- 多元統(tǒng)計(jì)分析課程設(shè)計(jì)
- 概率論與數(shù)理統(tǒng)計(jì)學(xué)研究生課程論文-玉米二比空栽培對其生長發(fā)育及產(chǎn)量的統(tǒng)計(jì)分析
- 2009年級藥學(xué)本科醫(yī)藥數(shù)理統(tǒng)計(jì)學(xué)方法課程進(jìn)度表
- 概率論與數(shù)理統(tǒng)計(jì)學(xué)習(xí)心得
- 應(yīng)用多元統(tǒng)計(jì)分析課程設(shè)計(jì)
- 應(yīng)用多元統(tǒng)計(jì)分析課程設(shè)計(jì)
- 巖體裂隙分組的拓?fù)鋵W(xué)及數(shù)理統(tǒng)計(jì)分析.pdf
- 數(shù)理經(jīng)營統(tǒng)計(jì)分析技能提升培訓(xùn)課程
- 調(diào)度指揮與統(tǒng)計(jì)分析課程設(shè)計(jì)
- 統(tǒng)計(jì)學(xué)課程設(shè)計(jì)
評論
0/150
提交評論