版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、第 2 章 數據的搜集,2.1 數據的來源2.2 調查數據2.3 實驗數據2.4 數據的誤差,學習目標,數據的來源搜集數據的調查方法問卷設計搜集數據的實驗方法數據的誤差數據的質量要求,重點 1.搜集數據的基本方法 2.統(tǒng)計問卷設計 難點 統(tǒng)計問卷設計,本章教學重點與難點,統(tǒng)計調查,,,統(tǒng)計整理,,,統(tǒng)計分析,,有組織、有計劃地搜集資料。要求:準確、完整、及時,對調查資料
2、去偽存真、去粗取精、科學分類、濃縮簡化,描述性分析推斷分析、決策分析。要求:定性定量結合,,,,,,,統(tǒng)計工作的三個中心階段,,是按照預定的統(tǒng)計研究任務,運用科學的調查方法,有組織地向社會實際搜集統(tǒng)計資料的過程。,統(tǒng)計調查所搜集的數字資料主要是原始資料,同時也包括對次級資料的搜集,原始資料是指說明總體單位特征的資料;次級資料是指已經經過加工整理,由個體過渡到總體,能夠在一定程度上說明所研究總體的統(tǒng)計資料,統(tǒng)計調查,統(tǒng)計調
3、查的基本要求,準確,及時,完整,統(tǒng)計調查所搜集的資料必須實事求是,如實反映客觀事物。,指統(tǒng)計調查資料的時效性,反映客觀事物的靈敏性。,包括調查單位的完整(全部應調查單位)和統(tǒng)計資料的完整(全部應登記的標志)。,2.1 數據的來源,2.1.1 數據的間接來源2.1.2 數據的直接來源,數據的間接來源,系統(tǒng)外部的數據,統(tǒng)計部門和政府部門公布的有關資料,如各類統(tǒng)計年鑒各類經濟信息中心、信息咨詢機構、專業(yè)調查機構等提供的數據各類
4、專業(yè)期刊、報紙、書籍所提供的資料各種會議,如博覽會、展銷會、交易會及專業(yè)性、學術性研討會上交流的有關資料從互聯(lián)網或圖書館查閱到的相關資料,系統(tǒng)內部的數據,業(yè)務資料,如與業(yè)務經營活動有關的各種單據,記錄經營活動過程中的各種統(tǒng)計報表各種財務,會計核算和分析資料等,二手數據的特點,搜集容易,采集成本低作用廣泛分析所要研究的問題提供研究問題的背景幫助研究者更好地定義問題檢驗和回答某些疑問和假設尋找研究問題的思路和途徑搜
5、集二手資料在研究中應優(yōu)先考慮,二手數據的評估,數據是誰搜集的?可信度評估為什么目的而搜集的?數據是怎樣搜集的? 什么時候搜集的?,數據的直接來源,數據的直接來源(原始數據),調查數據通過調查方法獲得的數據通常是對社會現(xiàn)象而言通常取自有限總體 實驗數據通過實驗方法得到的數據通常是對自然現(xiàn)象而言 也被廣泛運用到社會科學中如心理學、教育學、社會學、經濟學、管理學等,2.2 調查數據,2.2.1 概率抽樣與非概率抽
6、樣2.2.2 搜集數據的基本方法,(為什么調查),(向誰調查),(調查什么),,,,統(tǒng)計調查方案的設計,(何時調查),注意調查單位與填報單位 的區(qū)別:,當調查單位自己負責向上報告時,它同時也是填報單位;當調查單位的資料由它的上級組織收集、整理,并向上報告時,填報單位與報告單位則不一致。,,例:,,單一表,一覽表,單一表又稱卡片式,是指一張表只登記一個單位情況的表式;,一覽表是把多個調查單位和相應的項目按次序登記在一張表格里的統(tǒng)計表
7、。,調查表,,調查項目,根據調查目的、任務所確定的調查內容,通常也叫做調查綱要。,調查項目要明確、易懂,避免引起誤會或出現(xiàn)差錯,調查時間,調查時間是指調查資料所屬的時間,包括調查期限及調查資料所屬的時期或時點。,調查期限,調查期限是指進行統(tǒng)計調查工作的起止時間,包括搜集和報送資料的整個工作所需要的時間。為保證統(tǒng)計資料的及時性,應盡量縮短調查期限。,調查時間應根據不同調查項目的要求確定,時期現(xiàn)象,應規(guī)定資料所反映的是從何時起至何時止的
8、資料,時點現(xiàn)象,應明確規(guī)定統(tǒng)一的標準調查時點,名稱、編號、制表單位、填表日期等等,被調查者的基本情況、調查項目等等,備注、指標解釋等,調查表的基本結構:,概率抽樣和非概率抽樣,概率抽樣(probability sampling),也稱隨機抽樣特點按一定的概率以隨機原則抽取樣本抽取樣本時使每個單位都有一定的機會被抽中每個單位被抽中的概率是已知的,或是可以計算出來的 當用樣本對總體目標量進行估計時,要考慮到每個樣本單位被抽中的概率
9、,簡單隨機抽樣(simple random sampling),從總體N個單位中隨機地抽取n個單位作為樣本,每個單位入抽樣本的概率是相等的最基本的抽樣方法,是其它抽樣方法的基礎特點簡單、直觀,在抽樣框完整時,可直接從中抽取樣本用樣本統(tǒng)計量對目標量進行估計比較方便局限性當N 很大時,不易構造抽樣框抽出的單位很分散,給實施調查增加了困難沒有利用其它輔助信息以提高估計的效率,分層抽樣(stratified sampling),
10、將抽樣單位按某種特征或某種規(guī)則劃分為不同的層,然后從不同的層中獨立、隨機地抽取樣本優(yōu)點保證樣本的結構與總體的結構比較相近,從而提高估計的精度組織實施調查方便既可以對總體參數進行估計,也可以對各層的目標量進行估計,整群抽樣(cluster sampling),將總體中若干個單位合并為組(群),抽樣時直接抽取群,然后對中選群中的所有單位全部實施調查特點抽樣時只需群的抽樣框,可簡化工作量調查的地點相對集中,節(jié)省調查費用,方便調查
11、的實施缺點是估計的精度較差,系統(tǒng)抽樣(systematic sampling),將總體中的所有單位(抽樣單位)按一定順序排列,在規(guī)定的范圍內隨機地抽取一個單位作為初始單位,然后按事先規(guī)定好的規(guī)則確定其它樣本單位先從數字1到k之間隨機抽取一個數字r作為初始單位,以后依次取r+k,r+2k…等單位優(yōu)點:操作簡便,可提高估計的精度缺點:對估計量方差的估計比較困難,多階段抽樣(multi-stage sampling),先抽取群,但并不
12、是調查群內的所有單位,而是再進行一步抽樣,從選中的群中抽取出若干個單位進行調查二階抽樣中群是初級抽樣單位,第二階段抽取的是最終抽樣單位。將該方法推廣,使抽樣的階段數增多,就稱為多階段抽樣具有整群抽樣的優(yōu)點,保證樣本相對集中,節(jié)約調查費用需要包含所有低階段抽樣單位的抽樣框;同時由于實行了再抽樣,使調查單位在更廣泛的范圍內展開在大規(guī)模的抽樣調查中,是經常被采用的方法,非概率抽樣(non-probability sampling),相
13、對于概率抽樣而言抽取樣本時不是依據隨機原則,而是根據研究目的對數據的要求,采用某種方式從總體中抽出部分單位對其實施調查有方便抽樣、判斷抽樣、自愿樣本、滾雪球抽樣、配額抽樣等方式,方便抽樣,調查過程中由調查員依據方便的原則,自行確定入抽樣本的單位調查員在街頭、公園、商店等公共場所進行攔截調查廠家在出售產品柜臺前對路過顧客進行的調查優(yōu)點:容易實施,調查的成本低缺點:樣本單位的確定帶有隨意性,樣本無法代表有明確定義的總體,調查結果
14、不宜推斷總體,判斷抽樣,研究人員根據經驗、判斷和對研究對象的了解,有目的選擇一些單位作為樣本有重點抽樣,典型抽樣,代表抽樣等方式判斷抽樣是主觀的,樣本選擇的好壞取決于調研者的判斷、經驗、專業(yè)程度和創(chuàng)造性抽樣成本比較低,容易操作樣本是人為確定的,沒有依據隨機的原則,調查結果不能用于推斷總體,自愿樣本,被調查者自愿參加,成為樣本中的一分子,向調查人員提供有關信息例如,參與報刊上和互聯(lián)網上刊登的調查問卷活動,向某類節(jié)目撥打熱線電話等
15、,都屬于自愿樣本自愿樣本與抽樣的隨機性無關樣本是有偏的不能依據樣本的信息推斷總體,滾雪球抽樣,先選擇一組調查單位,對其實施調查之后,再請他們提供另外一些屬于研究總體的調查對象,調查人員根據所提供的線索,進行此后的調查。這個過程持續(xù)下去,就會形成滾雪球效應適合于對稀少群體和特定群體研究優(yōu)點:容易找到那些屬于特定群體的被調查者,調查的成本也比較低,配額抽樣,先將總體中的所有單位按一定的標志(變量)分為若干類,然后在每個類中采用方便
16、抽樣或判斷抽樣的方式選取樣本單位操作簡單,可以保證總體中不同類別的單位都能包括在所抽的樣本之中,使得樣本的結構和總體的結構類似抽取具體樣本單位時,不是依據隨機原則,屬于非概率抽樣,概率抽樣與非概率抽樣的比較,概率抽樣依據隨機原則抽選樣本樣本統(tǒng)計量的理論分布存在可根據調查的結果推斷總體非概率抽樣不是依據隨機原則抽選樣本樣本統(tǒng)計量的分布是不確定的無法使用樣本的結果推斷總體,搜集數據的基本方法,搜集數據的基本方法,問卷調查,
17、又稱民意調查,是以社會成員對一定社會經濟現(xiàn)象的看法和意愿為對象,從而推斷社會心態(tài)動向的一種調查。,問卷調查一般是為了特定的調查目的,以問卷形式提問,由被調查者自愿回答的一種搜集資料的方法。,,適用于社會經濟生活中進行探索性、解釋性、描述性等各項研究。,問卷調查,問卷總體結構設計:,解釋調查意義、目的,有關注意事項,表達感激之情等。,被調查者基本情況、調查項目、回答問題的方式等,調查項目的解釋、問卷填寫方法、填 寫要求、問卷寄送
18、方式等,問卷設計,,,應屆大學畢業(yè)生心態(tài)調查問卷,親愛的同學:您好! 您在大學的學習即將結束,將要走上工作崗位。當前您最關心、最擔心的問題是畢業(yè)就業(yè)問題。為了了解您在這方面有什么想法和看法、希望和要求,以便向各級黨政領導及有關部門反映,以求得此問題較為合理的解決,我們開展了這次調查。 填寫此問卷是不記名的。希望您在填答時不要有任何顧慮,根據您的實際情況如實填寫,說出您的心里話。對此我們負責保密。 謝謝您的支持與合
19、作! ****省調查隊,問卷說明,填表說明,1、請在每一問題后所給的備選答案中選擇符合您情況或您同意的答案,并在所選答案后的 內打“√”,或在問題的----處填寫適當的內容。2、若無特殊說明,每一問題只能選擇一個答案;若還要對所選多項答案排序,則請按題后說明填寫。3、問卷內容較多,涉及面廣,
20、請在填答之前認真閱讀一遍,然后按要求仔細填寫。,,問卷內容設計,問題的措詞應注意,1、提問確切,避免出現(xiàn)模棱兩可的問題,3、問題應以中性形式提出,不能參雜調查者的意圖和觀點,不能暗示、誘導,2、每一個問題都應可以獨立作答,不能把幾個問題合并成一個問題,4、針對不同的調查對象,采用合適的表達方式和恰當的措詞設問,5、各個問題的備選答案必須具有互斥性,不能模糊不清,,,,例1:“上個星期您總共看了幾小時書?”其中“書”是否包括雜志、報刊?又
21、如:“您每個月的收入是多少?”其中“收入”是否包括獎金、津貼和其他收入?,例2:您為什么不喝牛奶而換喝豆?jié){?這一問句包含了三層意思:1、您為什么不喝牛奶?2、您為什么改喝豆?jié){而不改喝其它?3、什么原因使您更換流食?,例3:“大家都認為某教師的課上得好,您的看法如何?”,“政府的收購政策大家都認為好,您的看法呢?”,問卷內容設計,,,例4:“您父母贊同您的婚姻嗎?”這里父母指兩個人,若遇到父親贊成、母親反對或母親贊成父親反映,應答者如何回
22、答呢?,例5:“您的職業(yè)是①企業(yè)職工;②經濟管理人員;③干部;④商業(yè)服務人員;⑤農民;⑥軍人;⑦學生;⑧教科文衛(wèi)人員”。答案交叉重復現(xiàn)象很多,使應答者無所適從。,問卷內容設計,問卷的問題結構,指問卷中問題的排列順序,其一般規(guī)則有:,按問題的類型,按事實性問題、行為性問題、態(tài)度性問題的順序將同類問題排列在一起,避免相互混雜,按問題的難易程度,先易后難,先熟悉的問題后生疏的問題,先一般性后特殊,按問題的時間順序,按問題的空間順序,為了便于被
23、調查者記憶,可以按時間先后順序排列,先近后遠,由近及遠,問卷的類型,按問卷的結構分,無結構型問卷,結構型問卷,問卷的內容結構較為松散或較為簡單的問卷。調查者調查之前準備調查提綱,明確調查目的,擬定調查內容的項目,但不必事先列出答案格式,被調查者可以根據各自的情況自由回答。,指根據調查研究的目的和調查對象的特點而設計的具有結構的問卷。這種問卷一般都把所有擬調查的問題全部列于問卷上,并在問題的后面給出答案類型,由被調查者依照自己的認識和想法
24、回答問題,容易控制,但不易全面,結構型問卷的問題類型:,容易滋生腐敗,您認為吸煙有哪些害處?①危害自身健康②影響他人健康③浪費錢財④容易引起火災⑤破壞家庭團結⑥其他( ),不易控制,但內容豐富,⒈您是否吸煙(如果選②,則跳過⒉、 ⒊題)①吸煙 ②不吸⒉您每天大約吸多少支煙 ?、?支以下?、?-10支 ③10-15支 ④15-20 ⑤20-25支 ⑥25支以上⒊您的吸
25、煙歷史大約有多長 ①1年以下?、?-5年?、?-10年?、?0年以上⒋您是否認為吸煙有害健康(請寫出理由),調查單位中吸煙人所占比例,吸煙人群日吸煙數量情況,吸煙人群吸煙歷史情況,調查對象對吸煙的看法,,⒈您是否吸煙(如果選②,則跳過⒉、 ⒊題)①吸煙?、诓晃材刻齑蠹s吸多少支煙 ?、?支以下?、?-10支 ③10-15支 ④15-20 ⑤20-25支 ⑥25支以上⒊您的吸
26、煙歷史大約有多長 ①1年以下?、?-5年?、?-10年?、?0年以上⒋您是否認為吸煙有害健康(請寫出理由),調查單位中吸煙人所占比例,吸煙人群日吸煙數量情況,吸煙人群吸煙歷史情況,,問卷設計的基本要求:,問題的提出要緊扣主題,問句和標準答案要易于理解和回答,先易后難、先封閉后開放、先基本問題后派生問題,以不超過20分鐘為宜,??????????????????????????????????????????,答題時間:
27、一般控制在20分鐘之內,過多的問題、過于難的問題將嚇跑被調查者。,自填式問卷調查,沒有調查員協(xié)助的情況下由被調查者自己完成調查問卷問卷遞送方法有:調查員分發(fā)、郵寄、網絡、媒體要求調查問卷結構嚴謹,有清楚的說明弱點問卷的返回率比較低不適合結構復雜的問卷調查周期比較長 數據搜集過程中出現(xiàn)的問題難于及時采取調改措施,面訪式問卷調查,調查員與被調查者面對面提問、被調查者回答的一種調查方式優(yōu)點可提高調查的回答率可提高調查數據的
28、質量能調節(jié)數據搜集所花費的時間弱點調查的成本較高調查過程的質量控制有一定難度,電話式問卷調查,通過電話向被調查者實施調查特點速度快,能在短時間內完成調查適合于樣本單位十分分散的情況局限如果被調查者沒有電話,調查將無法實施訪問的時間不能太長使用的問卷需要簡單被訪者不愿意接受調查時,難以說服,觀察式調查,1.就調查對象的行動和意識,調查人員邊觀察邊記錄以收集所需信息2.調查人員不是強行介入3.能夠在被調查者不察覺
29、的情況下獲得資料如交通流量的調查,各調查方法的比較,2.3 實驗數據,2.3.1 實驗組和對照組2.3.2 實驗中的若干問題2.3.3 實驗中的統(tǒng)計2.3.4 實驗法案例,實驗組和對照組,將研究對象分為兩組:實驗組和對照組實驗組和對照組的產生應遵循隨機原則,而且應該匹配匹配指對實驗單位的背景材料進行分析比較,將情況類似的每對單位分別隨機地分配到實驗組和對照組,實驗中的若干問題,人的意愿研究的對象是人的時候,在劃
30、分實驗組和對照組時的隨機原則將面臨挑戰(zhàn)心理問題 人們對被研究非常敏感,這使得他們更加注意自我,從而走到事物的另一個極端 道德問題 當某種實驗涉及道德問題時,人們會處于進退兩難的尷尬境地,實驗中的統(tǒng)計,實驗設計本身就是一個統(tǒng)計問題確定進行實驗所需要的單位的個數,以保證實驗可以達到統(tǒng)計顯著的結果將統(tǒng)計的思想融入到實驗設計中,使實驗設計符合統(tǒng)計分析的標準對實驗數據進行分析時,統(tǒng)計可以提供最恰當的分析方法,2.4 數據的誤差,
31、2.4.1 抽樣誤差2.4.2 非抽樣誤差2.4.3 誤差的控制,數據的誤差,抽樣誤差(sampling error),由于抽樣的隨機性所帶來的誤差 所有樣本可能的結果與總體真值之間的平均性差異 影響抽樣誤差的大小的因素樣本量的大小總體的變異性,非抽樣誤差(non-sampling error),相對抽樣誤差而言除抽樣誤差之外的,由于其他原因造成的樣本觀察結果與總體真值之間的差異存在于所有的調查之中概率抽樣,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 統(tǒng)計學第二章--統(tǒng)計數據的采集
- 統(tǒng)計學第二章描述
- 2.第二章-數據準備統(tǒng)計學專業(yè)---副本
- [學習]統(tǒng)計學ppt課件第二章數據與統(tǒng)計資料
- 《統(tǒng)計學基礎》單元二統(tǒng)計數據的搜集
- 統(tǒng)計學課件第2章數據的搜集配套講義
- 醫(yī)藥統(tǒng)計學-第二章-隨機事件與概率
- 統(tǒng)計學第二章描述性統(tǒng)計分析
- 統(tǒng)計學【第2章統(tǒng)計資料的搜集和整理】2016.09.06
- 概率統(tǒng)計第二章.
- 第二章 統(tǒng)計調查
- [學習]統(tǒng)計學第1章導論第二版
- 統(tǒng)計學(第二版)
- [學習]統(tǒng)計學原理02-第2章-統(tǒng)計資料的搜集與整理
- 數據挖掘第二章作業(yè)
- 統(tǒng)計學數據分析 統(tǒng)計學
- 第二章地圖學
- 教育學第二章
- 生態(tài)學第二章
- 農業(yè)推廣學第二章
評論
0/150
提交評論