版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、在進行統計調查的過程中,往往基于各種不同的原因導致調查數據存在不同程度的缺失。近年來,隨著大數據的發(fā)展和大型數據庫的成熟,無論從數據的樣本量和數據的維度的擴增角度還是數據記錄在時間維度的精細化程度加深,缺失值產生的概率越來越難以避免,并且數據缺失的形式也更加多樣化。然而,缺失值的存在對統計分析具有很大的影響。一方面來講,缺失值的存在增加了統計分析過程的難度,其原因在于成熟的數據分析方法都是基于完整數據集的前提假設。另一方面則是缺失數據的
2、存在會影響數據分析的結果,進而導致分析的結論有可能因為數據不具有代表性而喪失實用的價值。因此,研究缺失值的插補具有很重要的意義。目前,國內外對缺失值插補的關注度比較高,尤其是多重插補思想的提出及其在實踐中表現出的優(yōu)點,更加成為各學者研究的重點。
在數據調查中,調查問卷內容的不同往往也會導致調查數據的缺失值表現出不同的形態(tài)。缺失值的缺失機制、缺失模式、缺失程度及與其他相關變量的情況等都會對缺失值的插補方法和缺失效果產生一定的影響
3、。本文研究了隨機缺失模式下單變量隨機缺失和多變量的插補情況,重點討論了多重插補的插補情況。分別分析樣本量、缺失率程度及相關負責輔助變量等對基于判別分析模型下的多重插補插補效果的影響情況。
全文共分五個章節(jié),文章在第一個章節(jié)首先介紹選題背景和研究意義,總結了國內外關于缺失值插補,尤其是多重插補的研究現狀及研究成果。第2章則主要闡述了缺失值產生的原因和缺失機制,并指出雖然缺失值插補可以彌補部分數據缺失的不足但事前控制不可缺少。第3
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
評論
0/150
提交評論