版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第二章:數(shù)據(jù)的分類和收集,統(tǒng)計(jì)數(shù)據(jù)的分類,(按數(shù)據(jù)來(lái)源分) 統(tǒng)計(jì)數(shù)據(jù)的分類,初級(jí)數(shù)據(jù)與次級(jí)數(shù)據(jù)初級(jí)數(shù)據(jù): 如果數(shù)據(jù)分析和數(shù)據(jù)采集-置于同一整體方案指導(dǎo)下,從原始數(shù)據(jù)的載體或提供者那里采集數(shù)據(jù),繼而進(jìn)行分析,就稱統(tǒng)計(jì)分析使用的是初級(jí)數(shù)據(jù)。次級(jí)數(shù)據(jù): 如果進(jìn)行分析時(shí)數(shù)據(jù)來(lái)自本項(xiàng)統(tǒng)計(jì)活動(dòng)之外的數(shù)據(jù)采集和編輯結(jié)果,就稱統(tǒng)計(jì)分析使用的是次級(jí)數(shù)據(jù)。如:研究收入與教育、職業(yè)、家庭等因素的關(guān)系。,(按計(jì)量尺度分) 統(tǒng)計(jì)數(shù)據(jù)的分類,分類數(shù)據(jù)(c
2、ategorical data) 只能歸于某一類別的非數(shù)字型數(shù)據(jù)對(duì)事物進(jìn)行分類的結(jié)果,數(shù)據(jù)表現(xiàn)為類別,用文字來(lái)表述例如,人口按性別分為男、女兩類 順序數(shù)據(jù)(rank data) 只能歸于某一有序類別的非數(shù)字型數(shù)據(jù)對(duì)事物類別順序的測(cè)度,數(shù)據(jù)表現(xiàn)為類別,用文字來(lái)表述例如,產(chǎn)品分為一等品、二等品、三等品、次品等 數(shù)值型數(shù)據(jù)(metric data) 按數(shù)字尺度測(cè)量的觀察值結(jié)果表現(xiàn)為具體的數(shù)值,對(duì)事物的精確測(cè)度例如:身高為
3、175cm、168cm、183cm,(按收集方法分) 統(tǒng)計(jì)數(shù)據(jù)的分類,觀測(cè)的數(shù)據(jù)(observational data) 通過(guò)調(diào)查或觀測(cè)而收集到的數(shù)據(jù)在沒(méi)有對(duì)事物人為控制的條件下而得到的有關(guān)社會(huì)經(jīng)濟(jì)現(xiàn)象的統(tǒng)計(jì)數(shù)據(jù)幾乎都是觀測(cè)數(shù)據(jù)試驗(yàn)的數(shù)據(jù)(experimental data) 在試驗(yàn)中控制試驗(yàn)對(duì)象而收集到的數(shù)據(jù)比如,對(duì)一種新藥療效的試驗(yàn),對(duì)一種新的農(nóng)作物品種的試驗(yàn)等自然科學(xué)領(lǐng)域的數(shù)據(jù)大多數(shù)都為試驗(yàn)數(shù)據(jù),(按時(shí)間狀況分)
4、統(tǒng)計(jì)數(shù)據(jù)的分類,截面數(shù)據(jù)與時(shí)間序列數(shù)據(jù)截面數(shù)據(jù)(cross-sectional data) 在相同或近似相同的時(shí)間點(diǎn)上收集的數(shù)據(jù)描述現(xiàn)象在某一時(shí)刻的變化情況比如,2003年我國(guó)各地區(qū)的國(guó)內(nèi)生產(chǎn)總值數(shù)據(jù)時(shí)間序列數(shù)據(jù)(time series data) 在不同時(shí)間上收集到的數(shù)據(jù)描述現(xiàn)象隨時(shí)間變化的情況比如,1996年至2003年國(guó)內(nèi)生產(chǎn)總值數(shù)據(jù),統(tǒng)計(jì)數(shù)據(jù)的分類,定性數(shù)據(jù)和定量數(shù)據(jù)標(biāo)志(attribute)表示總體單位屬
5、性的名詞。數(shù)量標(biāo)志(quantitative attribute )表現(xiàn)為數(shù)量上不等的標(biāo)志。品質(zhì)標(biāo)志(qualitative attribute)表現(xiàn)為狀態(tài)上差異的標(biāo)志。,質(zhì)別數(shù)據(jù),量別數(shù)據(jù),,,統(tǒng)計(jì)數(shù)據(jù)的分類,統(tǒng)計(jì)數(shù)據(jù)的來(lái)源,(二手?jǐn)?shù)據(jù))統(tǒng)計(jì)數(shù)據(jù)的來(lái)源,政府、行業(yè)或者個(gè)人已經(jīng)公布或出版的各種數(shù)據(jù)統(tǒng)計(jì)部門和政府部門公布的有關(guān)資料,如各類統(tǒng)計(jì)年鑒各類經(jīng)濟(jì)信息中心、信息咨詢機(jī)構(gòu)、專業(yè)調(diào)查機(jī)構(gòu)等提供的數(shù)據(jù)各類專業(yè)期刊、報(bào)紙、書籍所
6、提供的資料各種會(huì)議,如博覽會(huì)、展銷會(huì)、交易會(huì)及專業(yè)性、學(xué)術(shù)性研討會(huì)上交流的有關(guān)資料從互聯(lián)網(wǎng)或圖書館查閱到的相關(guān)資料專門的數(shù)據(jù)公司,如A.C.尼爾森(A.C.Nielsen)公司、信息資源(Information Resources Inc.)公司。,(直接來(lái)源)統(tǒng)計(jì)數(shù)據(jù)的來(lái)源,統(tǒng)計(jì)調(diào)查統(tǒng)計(jì)調(diào)查分為普查和抽查普查(全面調(diào)查),是對(duì)總體無(wú)一遺漏地進(jìn)行調(diào)查。抽查(抽樣調(diào)查),從總體中抽取部分樣本進(jìn)行調(diào)查。按抽樣方式不同分為隨機(jī)調(diào)
7、查和非隨機(jī)調(diào)查。統(tǒng)計(jì)調(diào)查的工具問(wèn)卷調(diào)查卷,統(tǒng)計(jì)調(diào)查方式,統(tǒng)計(jì)調(diào)查方式,統(tǒng)計(jì)數(shù)據(jù)的采集,實(shí)驗(yàn)通過(guò)實(shí)驗(yàn)方法得到的數(shù)據(jù)通常是對(duì)自然現(xiàn)象而言 也被廣泛運(yùn)用到社會(huì)科學(xué)中如心理學(xué)、教育學(xué)、社會(huì)學(xué)、經(jīng)濟(jì)學(xué)、管理學(xué)等試驗(yàn)設(shè)計(jì)對(duì)照原則齊同原則隨機(jī)原則觀察研究,統(tǒng)計(jì)調(diào)查方式,抽樣方法,概率抽樣,根據(jù)一個(gè)已知的概率來(lái)抽取樣本單位,也稱隨機(jī)抽樣.特點(diǎn)按一定的概率以隨機(jī)原則抽取樣本抽取樣本時(shí)使每個(gè)單位都有一定的機(jī)會(huì)被抽中每個(gè)單位被
8、抽中的概率是已知的,或是可以計(jì)算出來(lái)的 當(dāng)用樣本對(duì)總體目標(biāo)量進(jìn)行估計(jì)時(shí),要考慮到每個(gè)樣本單位被抽中的概率,簡(jiǎn)單隨機(jī)抽樣,從總體N個(gè)單位中隨機(jī)地抽取n個(gè)單位作為樣本,使得每一個(gè)容量為n樣本都有相同的機(jī)會(huì)(概率)被抽中 抽取元素的具體方法有重復(fù)抽樣和不重復(fù)抽樣特點(diǎn)簡(jiǎn)單、直觀,在抽樣框完整時(shí),可直接從中抽取樣本用樣本統(tǒng)計(jì)量對(duì)目標(biāo)量進(jìn)行估計(jì)比較方便局限性當(dāng)N很大時(shí),不易構(gòu)造抽樣框抽出的單位很分散,給實(shí)施調(diào)查增加了困難沒(méi)有利用其
9、他輔助信息以提高估計(jì)的效率,簡(jiǎn)單隨機(jī)抽樣,【例】某公司想從800名專職雇員中抽取一個(gè)由32名專職雇員組成的樣本,來(lái)獲得有關(guān)公司發(fā)起的護(hù)牙計(jì)劃支出情況的信息。公司認(rèn)為,并非每個(gè)人都愿意回答問(wèn)卷,因此他們必須寄多于32份的問(wèn)卷才能獲得想要的32份答案。假設(shè)平均每10個(gè)專職雇員中有8人愿意回答調(diào)查問(wèn)卷(即80%的回答率),就必須抽取總數(shù)為40個(gè)雇員的樣本才能得到想要的32份回答。因此,要從公司的個(gè)人檔案中抽取40名專職雇員。在實(shí)際工作中,該怎
10、樣進(jìn)行簡(jiǎn)單隨機(jī)抽樣?,系統(tǒng)抽樣(等距抽樣),將總體中的所有單位(抽樣單位)按一定順序排列,在規(guī)定的范圍內(nèi)隨機(jī)地抽取一個(gè)單位作為初始單位,然后按事先規(guī)定好的規(guī)則確定其他樣本單位先從數(shù)字1到k之間隨機(jī)抽取一個(gè)數(shù)字r作為初始單位,以后依次取r+k,r+2k…等單位優(yōu)點(diǎn):操作簡(jiǎn)便,可提高估計(jì)的精度缺點(diǎn):對(duì)估計(jì)量方差的估計(jì)比較困難【例】續(xù)上例,分層抽樣,將總體單位按某種特征或某種規(guī)則劃分為不同的層(類),然后從不同的層中獨(dú)立、隨機(jī)地抽取樣
11、本原則:層間差異較大,而層內(nèi)差異較小優(yōu)點(diǎn)保證樣本的結(jié)構(gòu)與總體的結(jié)構(gòu)比較相近,從而提高估計(jì)的精度組織實(shí)施調(diào)查方便既可以對(duì)總體參數(shù)進(jìn)行估計(jì),也可以對(duì)各層的目標(biāo)量進(jìn)行估計(jì),分層抽樣,【例】假設(shè)某大學(xué)的商學(xué)院想對(duì)今年的畢業(yè)生進(jìn)行一次調(diào)查,以便了解他們的就業(yè)傾向。該學(xué)院有5個(gè)專業(yè):會(huì)計(jì),金融,市場(chǎng)營(yíng)銷,經(jīng)營(yíng)管理,信息系統(tǒng)。今年共有1500名畢業(yè)生,其中會(huì)計(jì)專業(yè)500名,金融專業(yè)350名,市場(chǎng)營(yíng)銷專業(yè)300名,經(jīng)營(yíng)管理專業(yè)150名,信息系
12、統(tǒng)專業(yè)200名。假定要選取180人作為樣本,各專業(yè)應(yīng)抽取的人數(shù)分別為:會(huì)計(jì)專業(yè)60人,金融專業(yè)62人,市場(chǎng)營(yíng)銷專業(yè)36人,經(jīng)營(yíng)管理專業(yè)18人,信息系統(tǒng)24人。,整群抽樣,將總體中若干個(gè)單位合并為組(群),抽樣時(shí)直接抽取群,然后對(duì)中選群中的所有單位全部實(shí)施調(diào)查 原則:群間差異小,群內(nèi)差異大。特點(diǎn)抽樣時(shí)只需群的抽樣框,可簡(jiǎn)化工作量調(diào)查的地點(diǎn)相對(duì)集中,節(jié)省調(diào)查費(fèi)用,方便調(diào)查的實(shí)施缺點(diǎn)是估計(jì)的精度較差,多階段抽樣,先抽取群,但并不是調(diào)
13、查群內(nèi)的所有單位,而是再進(jìn)行一步抽樣,從選中的群中抽取出若干個(gè)單位進(jìn)行調(diào)查群是初級(jí)抽樣單位,第二階段抽取的是最終抽樣單位。將該方法推廣,使抽樣的段數(shù)增多,就稱為多階段抽樣具有整群抽樣的優(yōu)點(diǎn),保證樣本相對(duì)集中,節(jié)約調(diào)查費(fèi)用需要包含所有低階段抽樣單位的抽樣框;同時(shí)由于實(shí)行了再抽樣,使調(diào)查單位在更廣泛的范圍內(nèi)展開(kāi)在大規(guī)模的抽樣調(diào)查中,經(jīng)常被采用的方法,非概率抽樣,相對(duì)于概率抽樣而言抽取樣本時(shí)不是依據(jù)隨機(jī)原則,而是根據(jù)研究目的對(duì)數(shù)據(jù)的
14、要求,采用某種方式從總體中抽出部分單位對(duì)其實(shí)施調(diào)查有方便抽樣、判斷抽樣、自愿樣本、滾雪球抽樣、配額抽樣等方式,方便抽樣,調(diào)查過(guò)程中由調(diào)查員依據(jù)方便的原則,自行確定入抽樣本的單位調(diào)查員在街頭、公園、商店等公共場(chǎng)所進(jìn)行攔截調(diào)查廠家在出售產(chǎn)品柜臺(tái)前對(duì)路過(guò)顧客進(jìn)行的調(diào)查優(yōu)點(diǎn):容易實(shí)施,調(diào)查的成本低缺點(diǎn):樣本單位的確定帶有隨意性,樣本無(wú)法代表有明確定義的總體,調(diào)查結(jié)果不宜推斷總體,判斷抽樣,研究人員根據(jù)經(jīng)驗(yàn)、判斷和對(duì)研究對(duì)象的了解,有目
15、的選擇一些單位作為樣本有重點(diǎn)抽樣,典型抽樣,代表抽樣等方式判斷抽樣是主觀的,樣本選擇的好壞取決于調(diào)研者的判斷、經(jīng)驗(yàn)、專業(yè)程度和創(chuàng)造性抽樣成本比較低,容易操作樣本是人為確定的,沒(méi)有依據(jù)隨機(jī)的原則,調(diào)查結(jié)果不能用于對(duì)推斷總體,自愿樣本,被調(diào)查者自愿參加,成為樣本中的一分子,向調(diào)查人員提供有關(guān)信息例如,參與報(bào)刊上和互聯(lián)網(wǎng)上刊登的調(diào)查問(wèn)卷活動(dòng),向某類節(jié)目撥打熱線電話等,都屬于自愿樣本自愿樣本與抽樣的隨機(jī)性無(wú)關(guān)樣本是有偏的不能依據(jù)
16、樣本的信息推斷總體,滾雪球抽樣,先選擇一組調(diào)查單位,對(duì)其實(shí)施調(diào)查之后,再請(qǐng)他們提供另外一些屬于研究總體的調(diào)查對(duì)象,調(diào)查人員根據(jù)所提供的線索,進(jìn)行此后的調(diào)查。這個(gè)過(guò)程持續(xù)下去,就會(huì)形成滾雪球效應(yīng)適合于對(duì)稀少群體和特定群體研究?jī)?yōu)點(diǎn):容易找到那些屬于特定群體的被調(diào)查者,調(diào)查的成本也比較低,配額抽樣,先將體中的所有單位按一定的標(biāo)志(變量)分為若干類,然后在每個(gè)類中采用方便抽樣或判斷抽樣的方式選取樣本單位操作簡(jiǎn)單,可以保證總體中不同類別的單
17、位都能包括在所抽的樣本之中,使得樣本的結(jié)構(gòu)和總體的結(jié)構(gòu)類似抽取具體樣本單位時(shí),不是依據(jù)隨機(jī)原則,屬于非概率抽樣,概率抽樣與非概率抽樣的比較,概率抽樣依據(jù)隨機(jī)原則抽選樣本樣本統(tǒng)計(jì)量的理論分布存在可根據(jù)調(diào)查的結(jié)果推斷總體非概率抽樣不是依據(jù)隨機(jī)原則抽選樣本樣本統(tǒng)計(jì)量的分布是不確定的無(wú)法使用樣本的結(jié)果推斷總體,數(shù)據(jù)的收集方法,數(shù)據(jù)的收集方法,數(shù)據(jù)的誤差,抽樣誤差,由于抽樣的隨機(jī)性所帶來(lái)的誤差 所有樣本可能的結(jié)果與總體真值之間的
18、平均性差異 影響抽樣誤差的大小的因素樣本量的大小總體的變異性,非抽樣誤差,相對(duì)抽樣誤差而言除抽樣誤差之外的,由于其他原因造成的樣本觀察結(jié)果與總體真值之間的差異存在于所有的調(diào)查之中概率抽樣,非概率抽樣,全面性調(diào)查有抽樣框誤差、回答誤差、無(wú)回答誤差、調(diào)查員誤差、測(cè)量誤差,誤差的控制,抽樣誤差可計(jì)算和控制非抽樣誤差的控制調(diào)查員的挑選調(diào)查員的培訓(xùn)督導(dǎo)員的調(diào)查專業(yè)水平調(diào)查過(guò)程控制調(diào)查結(jié)果進(jìn)行檢驗(yàn)、評(píng)估現(xiàn)場(chǎng)調(diào)查人員進(jìn)行獎(jiǎng)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- chapter2
- chapter2 習(xí)題答案
- 朗文英語(yǔ)六上chapter2
- chapter2 船機(jī)零件的磨損
- 02有限元chapter2彈性力學(xué)基礎(chǔ)
- chapter2高分子物理-遠(yuǎn)程結(jié)構(gòu)xinppt
- 應(yīng)用統(tǒng)計(jì)chapter10
- 應(yīng)用統(tǒng)計(jì)chapter1
- 應(yīng)用統(tǒng)計(jì)chapter8
- 精編chapter2國(guó)家藥物政策與藥品監(jiān)督管理
- 教育類論文集Innovating to Learn,Learning to Innovate(Chapter2,Chapter4)英漢翻譯實(shí)踐報(bào)告.pdf
- 法律語(yǔ)言學(xué)著作Patterns of Linguistic Variation in American Legal English(Chapter2)英漢翻譯實(shí)踐報(bào)告.pdf
- 現(xiàn)代移動(dòng)通信蔡躍明第三版思考題與習(xí)題參考答案chapter2
- 法律語(yǔ)言學(xué)著作Patterns of Linguistic Variation in American Legal English(Chapter2)英漢翻譯實(shí)踐報(bào)告_4245.pdf
- chapter 2 speech sounds
- chapter 2 memory in interpreting
- chapter 09 應(yīng)用層
- chapter 2 新古典貿(mào)易理論
- 香港朗文版2a期末復(fù)習(xí)資料 chapter1---chapter6
- 香港朗文版2a期末復(fù)習(xí)資料 chapter1---chapter6
評(píng)論
0/150
提交評(píng)論