第九章調查資料的整理方法_第1頁
已閱讀1頁,還剩72頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第10章 調查資料的整理方法,第一節(jié) 資料整理的意義和一般步驟第二節(jié) 資料的審核與匯總第三節(jié) 資料的分組第四節(jié) 制作統(tǒng)計表和統(tǒng)計圖,第一節(jié) 資料整理的意義和步驟,一、資料整理的涵義和作用二、資料整理的原則三、資料整理的一般步驟,,一、資料整理的涵義和作用,資料整理:是指運用科學的方法,將調查所得的原始資料按調查目的進行審核匯總與初步加工使之系統(tǒng)化和條理化,并以集中簡明的方式反映調查對象總體情況的過程。,資料整理的作用

2、:是對調查資料的全面檢查。搜集資料過程出現(xiàn)虛假、差錯、短缺、余冗等現(xiàn)象。需要對資料進行科學的整理與審核,檢漏補缺,去假存真,去粗取精,保證資料的真實、準確和完整。是進一步分析研究資料的基礎。對分散、零碎的資料進行加工整理,使之系統(tǒng)化、條理化,在此基礎上,對資料的分析研究才成為可能。是保存資料的客觀要求。對資料進行整理后能使原始資料具有真實性和可靠性,使原始資料具有長期保存和利用的價值。,一、資料整理的涵義和作用,二、資料整理的原則

3、,真實性。這是資料整理必須遵循的最基本原則。準確性。事實要準確,數(shù)據(jù)要準確,事實材料不能含糊不清、模棱兩可、互相矛盾。完整性。反映某一社會現(xiàn)象的資料必須盡可能全面,如實地反映該現(xiàn)象的全貌,不能殘缺不全。統(tǒng)一性。各個調查指標要有統(tǒng)一的理解和解釋,對調查指標的計算方法和計算單位也要統(tǒng)一。簡明性。整理后的資料要以簡單、明確、集中的形式反映出來。,三、資料整理的一般步驟,資料的審核,資料的編碼,資料的分組,資料的匯總,,,,制作統(tǒng)計表和

4、統(tǒng)計圖,,1.資料的審核:審查資料的真實性、準確性和完整性,發(fā)現(xiàn)問題,及時解決。,三、資料整理的一般步驟(續(xù)),2.資料的編碼:如果所收集的資料要輸入計算機處理,必須對原始資料進行編碼。,3.資料的分組:根據(jù)調查的目的和任務及分析研究對象的需要,確定分組標志,對原始資料進行分組整理與統(tǒng)計。,三、資料整理的一般步驟(續(xù)),4.資料的匯總:將分散資料以集中的形式顯示出來。全 部數(shù)據(jù)匯總,或在分

5、組基礎上匯總。5.制作統(tǒng)計表和統(tǒng)計圖:以統(tǒng)計表和統(tǒng)計圖的形式, 集中、簡明、直觀的顯示匯總資料。,三、資料整理的一般步驟(續(xù)),第二節(jié) 資料的審核與匯總,一、資料審核的一般要求二、資料審核的方法三、資料的編碼四、資料的匯總,,一、資料審核的一般要求,真實性:調查資料來源的客觀性;調查資料本身的真實性.準確性:著重檢查那些含糊不清的、籠籠統(tǒng)統(tǒng)的以及相互矛盾的資料。完整性:調查資料總體的完整性,即檢

6、查是否按設計過程進行等;每份調查資料的完整性。,第二節(jié) 資料的審核與匯總,二、資料審核的方法,邏輯審核:即檢查調查資料的內容是否合乎邏輯和常識,項目之間有無互相矛盾之處,與其他有關資料進行對照是否有明顯出入等等。計算審核:即針對數(shù)字資料進行的審查。要檢查計算方法有無錯誤,度量單位有沒有用錯,前后數(shù)字之間有無相互矛盾之處。資料的審核中,如發(fā)現(xiàn)問題,視情況及時處理;補充或糾正、注意在離開調查現(xiàn)場前進行審核。,第二節(jié) 資料的審核與匯總

7、,三、資料的編碼,整理后的資料一般均要使用計算機進行數(shù)據(jù)處理,在資料的整理工作中須對資料進行編碼,即將問卷或調查表中的信息轉化成計算機能識別的數(shù)字符號。多用于結構性調查,如結構式問卷?!獙τ趩柧肀砘蛘{查表中的少數(shù)開放式問題,可在對所有回答進行分類的基礎上,給每一類回答定一個代號,制成編碼表?!獙τ谟媱澯糜嬎銠C處理的數(shù)據(jù)資料,事先可在問卷上寫上編碼?!幋a的技術或技巧。,第二節(jié) 資料的審核與匯總,四、資料的匯總,資料的匯總:根據(jù)

8、調查研究的目的,將資料中的各種分散的數(shù)據(jù)匯聚起來,以集中的形式反映調查單位的總體狀況以及調查總體的內部數(shù)量結構的一項工作。資料的匯總分為:—總體匯總是為了了解總體情況和總體發(fā)展趨勢的?!纸M匯總是為了了解總體內部的結構和差異的。,第二節(jié) 資料的審核與匯總,第三節(jié) 資料的分組,一、資料分組的涵義和作用二、分組標志的選擇三、分組的類型四、分配數(shù)列五、頻率與累積頻率,,分組:指根據(jù)事物的內在特點和統(tǒng)計研究的需要,按一定的標志

9、將統(tǒng)計總體區(qū)分為若干性質不同的組成部分的統(tǒng)計研究方法,分組前,分組后,一、資料分組的涵義和作用,例:按所有制性質劃分,我國現(xiàn)有8種經(jīng)濟類型:國有經(jīng)濟;集體經(jīng)濟;私營經(jīng)濟;個體經(jīng)濟聯(lián)營經(jīng)濟;股份制經(jīng)濟;外商投資經(jīng)濟;港澳臺投資經(jīng)濟。,資料分組作用:,1.劃分現(xiàn)象類型,一、資料分組的涵義和作用,2·研究總體結構,例:上海市按GDP計算的三次產(chǎn)業(yè)結構(%) 1980年1990年 1996年 2010年

10、 GDP100 100 100 100 第一產(chǎn)業(yè)3.2 4.3 2.5 0.7 第二產(chǎn)業(yè)75.7 63.8 54.5 42.3 第三產(chǎn)業(yè)21.1 31.9 43.0 57.0,3·研究現(xiàn)象之間的依存關系,例:中國農(nóng)村家庭人均收入與恩格爾系數(shù)的關系,資料分組的作用(續(xù)),,資料分組具有兩方面的含義:從現(xiàn)象

11、總體角度看,它是“分”的過程,是將現(xiàn)象總體中的各個單位劃分為若干性質不同的組成部分;從現(xiàn)象個體角度看,它又是“合”的過程,是把現(xiàn)象總體中性質相同的單位組合成一組。,關鍵:服從研究任務需要,反映總體本質特征,選擇分組標志的原則,根據(jù)統(tǒng)計研究的目的選擇分組標志,根據(jù)現(xiàn)象的本質特征選擇分組標志,考慮現(xiàn)象所處的具體時空條件。,二、分組標志的選擇,所謂標志,是指反映事物屬性或特征的名稱。,(一)按分組標志性質的不同劃分:品質標志是反映事物屬性

12、的標志,如老年人按婚姻狀況、戶居方式、受教育水平分組;流浪兒童按外流原原因、外流生活來源、流出地分組;人口職業(yè)分組等。數(shù)量標志是反映事物數(shù)量特征的標志,如分析貧困問題將貧困戶按家庭人口分組,了解職工生活按經(jīng)濟收入分組,研究地區(qū)的社會保險按參保企業(yè)個數(shù)分組等。按數(shù)量標志分組,必須以分組結果能夠反映被研究現(xiàn)象的不同類型和性質差異為前提。,三、分組的類型,三、分組的類型,(二)按分組標志數(shù)量的多少劃分 :簡單分組:對調查對象只按一個標志

13、進行的分組。如農(nóng)村居民按家庭人均收入分組,婦女按初婚年齡分組,職工按性別分組等。它們分別只能從一個角度說明現(xiàn)象的分布狀況和內部構成。同總體的幾個簡單分組按某一規(guī)定排列起來就構成了一個平行分組體系。人口按性別、年齡、民族等標志進行分組,這些簡單分組排列起來,就是平行分組體系 。復合分組:用兩個或兩個以上的標志對調查對象依次進行的分組。復合分組時,先按一個標志分組,然后,再對每一個組別按另一個標志作進一步分組。復合復合分組在分組時

14、,應根據(jù)分析的要求,確定分組標志的主次順序,主要標志在先,次要標志在后。,,,(三)按數(shù)量標志值的變動范圍劃分: 當數(shù)量標志值的變化范圍較小,而且標志值的項數(shù)不多時,可進行單項式分組,即可直接將每個標志值列為一組。(百分制)當數(shù)量標志值的變動范圍較大,標志值的項數(shù)又較多時,就可將一些鄰近的標志值合并為一組,作為分組的依據(jù),以減少組的數(shù)量,即組距式分組。(五分制)采用組距分組時,需要遵循“不重不漏”的原則。(“上組限(組內最大值)不

15、在內” ),三、分組的類型,統(tǒng)計分組的程序與原則,選擇分組標志,確定分組體系,總體單位歸類,,,科學性:組間差異大,組內差異小。,完備性和互斥性:每個單位均能且只能歸到某個組中。,擬定分組數(shù)目,即決定分成哪些組,各組的內容、名稱和界限。,互斥性,包容性,指各組之間界限明確,總體中的每一個單位,都只應屬于其中的一個組。,,指在一個分組方案中擬定的所有組,能夠包容總體的全部單位,不能排斥和遺漏任何一個單位。,按品質標志分組,按數(shù)量標志分組,

16、選擇反映事物數(shù)量方面的差別的標志作為分組依據(jù),選擇反映事物屬性差異的標志作為分組依據(jù)。,單項式分組,指用單一的數(shù)值作為分組標志的分組。每個數(shù)值作為一個組。,某班學生按年齡分組:,按數(shù)量標志分組的形式,例:某車間20名工人日加工零件數(shù)如下:,采用單項式分組,可形成下表的頻數(shù)分布:,但對于數(shù)據(jù)較多,或連續(xù)型變量則無法采用這種分組方法,而應采用組距分組。,組距式分組,將作為分組依據(jù)的數(shù)量標志的整個取值范圍依次劃分為若干個滿足互斥性和包容性的

17、區(qū)間,用這些數(shù)值區(qū)間作為組的名稱。,某班學生統(tǒng)計學成績分組,60分以下60—70分70—80分80—90分90分以上,例如,某生產(chǎn)車間50名工人日加工零件數(shù)如下(單位:個)。對數(shù)據(jù)進行組距分組:,某車間50名工作日加工零件數(shù)分組表,組限,上限,下限,區(qū)間數(shù)值的最大值,區(qū)間數(shù)值的最小值,組距,每一組的區(qū)間長度,,組距=上限-下限,組中值,每一組中點位置的數(shù)值,組中值=(上限+下限)÷2,開口組,缺少上限數(shù)值或下限數(shù)值的組,注意

18、,開口組以相鄰組的組距作為該組的組距,確定其下限或上限,再計算組中值。,組距式分組中的一些概念,某地區(qū)100個國有企業(yè)月銷售額與流通費用情況,如:組距d=U-L=100-50=50(萬元),如:組中值x=(U+L)/2 =(100+200)/2=150(萬元),上組限U,下組限L,等距分組,異距分組,例如,60分以下60—70分70—80分80—90分90分以上,組中值為(90+100)÷2=95,各組組距相等的分

19、組稱為等距分組。,各組組距不全相等的分組稱為異距分組。,下限在內,上限不在內原則,組中值為(60+50)÷2=55,,分類,,四、分配數(shù)列,射擊 射擊 體操 體操 乒乓球 舉重乒乓球 羽毛球 舉重 乒乓球 羽毛球舉重 舉重 跳水 跳水 跳水 乒乓球跳水 射擊 體操 羽毛球 柔道 柔道舉重 田徑 羽毛球 跆拳道,中國體育代表團在悉尼奧運會上獲金牌的項目,品質數(shù)列的編制,,獲金牌項目  金牌數(shù) 占總數(shù)比例 跳

20、水   ?。得?0.1786 舉重   ?。得?0.1786 乒乓球   4枚 0.1429 羽毛球  ?。疵?0.1429 體操    3枚 0.1071 射擊   ?。趁?0.1071 柔道   ?。裁?0.0714 田徑    1枚

21、 0.0357 跆拳道  ?。泵?0.0357,品質數(shù)列的編制,獲金牌項目  金牌數(shù) 占總數(shù)比例 跳水   ?。得?0.1786 舉重    5枚 0.1786 乒乓球  ?。疵?0.1429 羽毛球  ?。疵?0.1429 體操   ?。趁?

22、 0.1071 射擊   ?。趁?0.1071 柔道   ?。裁?0.0714 田徑    1枚 0.0357 跆拳道  ?。泵?0.0357,次數(shù)(頻數(shù)) f,頻率f /∑f,變量值x,品質數(shù)列的編制,同時具備,【例】己知某車間有24名工人,他們的日產(chǎn)量(件)分別是:20,23,20,24,23,21,22

23、,25,26,20,21,21,22,22,23,22,22,24,25,21,22,21,24,23.要求根據(jù)以上資料編制變量數(shù)列。,變量數(shù)列的編制,編制結果如下:,變量數(shù)列的編制,變量值變動區(qū)間的長度相等,,變量值變動區(qū)間的長度不完全相等,編制等距數(shù)列,適用于總體單位的標志值變動比較均勻的情況,實例,己知某班35個學生統(tǒng)計學期末考試成績如下,單位(分)44 50 56 60 62 63 65

24、 65 69 69 69 70 74 76 77 78 78 79 80 83 84 85 8586 87 88 89 90 91 91 92 93 94 94要求編制組距數(shù)列。,原始數(shù)據(jù),,計算組中值,排序,確定組限,,計算變異全距,,,確定組數(shù)、組距,,,匯總組單位數(shù),,制作組距

25、數(shù)列統(tǒng)計表,編制步驟或內容,組距數(shù)列的編制,編制步驟:,⒈求變異全距,⒉確定組距及組數(shù),確定組距的原則:,要能區(qū)分各組的性質差異要能反映總體資料的分布特征為方便計算,盡可能為5或10的整數(shù)倍,R≤組距(d) ×組數(shù)(m),編制等距數(shù)列,計算組數(shù)(組數(shù)不宜過多,也不宜太少),上例中,取d=10,則有,編制等距數(shù)列,(當 的結果為整數(shù)時),(當 的結果為小數(shù)時),⒊確定組限,編制等距數(shù)列,4、計算各組次數(shù),5、制作組距

26、數(shù)列,某班統(tǒng)計學考試成績表,累計次數(shù)(頻率),從變量值低的組開始,將各組次數(shù)(頻率)逐次向變量值高的組累計,說明某一組上限以下各組的累計次數(shù)(頻率)。,從變量值高的組開始,將各組次數(shù)(頻率)逐次向變量值低的組累計,說明某一組下限以上各組的累計次數(shù)(頻率)。,,,五、頻率與累積頻率,,第四節(jié) 統(tǒng)計表與統(tǒng)計圖的制作,一、統(tǒng)計表的結構、種類及制作方法二、統(tǒng)計圖的種類及制作方法,,一、統(tǒng)計表的結構、種類及制作方法,調查所收集的資料,經(jīng)過分組

27、、匯總整理之后,可以用不同的形式加以表現(xiàn),如統(tǒng)計表、統(tǒng)計圖等。統(tǒng)計表是運用得最為廣泛的一種形式,是利用表格形式,把一系列統(tǒng)計數(shù)字按照一定的次序和邏輯關系表達出來的一種方法。,統(tǒng)計表的作用,1、是表達和運用統(tǒng)計資料的特有形式,是進行定量分析研究的基本方法 。,2、使統(tǒng)計資料系統(tǒng)化、條理化、規(guī)范化、生動化。,3、清晰地顯示社會經(jīng)濟現(xiàn)象的活動過程和現(xiàn)象之間的復雜關系,一、統(tǒng)計表的結構、種類及制作方法,標題是統(tǒng)計表的名稱,位于表的頂端中央。它

28、的作用是簡要說明表中統(tǒng)計資料的內容,包括這些資料收集的時間和空間范圍等。橫標目,又稱統(tǒng)計表的主詞,是指統(tǒng)計表所要說明的對象,也即分組的名稱或標志值,通常寫在表的左邊。縱標目,又稱統(tǒng)計表的賓詞,是指調查指標或統(tǒng)計指標的名稱,通常寫在表的最上面一格。指標數(shù)值,是對資料進行統(tǒng)計整理的結果,是統(tǒng)計表的主體,一般有絕對數(shù)、相對數(shù)等。每一個數(shù)字都必須與橫標目、縱標目一一對應。,統(tǒng)計表,統(tǒng)計表的結構,統(tǒng)計表的結構,2000年我國工業(yè)總產(chǎn)值和增加

29、值,,,,主詞,賓詞,,總標題,,縱欄標題,,指標數(shù)值,資料來源:《中國統(tǒng)計年鑒》2001年注釋:工業(yè)總產(chǎn)值按工廠法計算。,,表外資料,橫行標題,簡單表,統(tǒng)計表的種類,統(tǒng)計表按主詞的分組情況可分為,指主詞未經(jīng)過任何分組的統(tǒng)計表,某地區(qū)2010年鐵礦計劃完成情況,一、統(tǒng)計表的結構、種類及制作方法,簡單分組表,統(tǒng)計表的種類,指總體按一個標志分組的統(tǒng)計表,某地區(qū)2010年各類型企業(yè)總產(chǎn)值表,復合分組表,統(tǒng)計表的種類,指總體按兩個或兩個以上標志

30、進行層疊分組的統(tǒng)計表,某系學生構成情況表 單位:人,統(tǒng)計表的制作,應遵循科學、實用、簡練、美觀的原則,須注意以下幾個問題:1.標題要簡短明了,要能確切說明資料的時間、空間范圍和基本內容。2.表的格式一般是開口式的,即表的左右兩端不劃豎線。表的上下兩端應劃粗橫線,其余皆為細線。3.若表的欄數(shù)(即賓詞)較多,為了引用與說明時方便起見,應在欄目的下面一格對各欄目加以編號。4.表內數(shù)字要填寫整齊,對準數(shù)位,不

31、留空白。當數(shù)字為零時,要添0,表明不是漏填;當數(shù)字客觀不存在時用“—”表示;缺項時用“…”表示。5.凡需說明的文字一律寫入表注。表注要簡明扼要。,一、統(tǒng)計表的結構、種類及制作方法,二、統(tǒng)計圖的種類及制作方法,統(tǒng)計圖是用幾何圖形或象形圖來顯示社會現(xiàn)象數(shù)量特征的一種重要工具。它具有直觀、形象、生動等特點,可以使讀者一目了然,具有較大的吸引力和說服力。,統(tǒng)計圖,指利用一定的圖形,將有關統(tǒng)計資料按照一定的比例圖示出來的一種方法。,統(tǒng)計圖的分

32、類,幾何圖,象形圖,統(tǒng)計地圖,按圖形表達分,用幾何的線和形來表示和分析統(tǒng)計資料的統(tǒng)計圖。如條形圖、曲線圖、圓形圖、方快圖、樹形圖、平面圖和立體圖等,是利用現(xiàn)象本身形象的簡化來表述和分析統(tǒng)計資料的統(tǒng)計圖,在地圖上用點、線、圖來表述和分析統(tǒng)計資料的統(tǒng)計圖,用來反映現(xiàn)象數(shù)量在 地區(qū)上的分布狀況,,條形圖,或稱柱形圖。它可以用來表示事物的大小、內部結構或動態(tài)變動等情況,應用范圍十分廣泛。,圓形圖,它是以圓形面積的大小或圓內扇形面積的大

33、小來表示事物的大小和事物內部各部分所占比重的圖形。它的作用主要是用來顯示事物內部的構成狀況。,曲線圖,曲線圖是用連續(xù)的起伏升降的線條來反映事物的動態(tài)或分布特征的一種統(tǒng)計圖。,2008年 2009年 2010年,2008~2010年全國植樹數(shù)量統(tǒng)計(百萬棵),5,8,12,比較圖,動態(tài)圖,進度圖,相關圖,分配圖,地區(qū)分布圖,結構圖,反映

34、總體內部各部分數(shù)量結構關系,反映現(xiàn)象總體數(shù)量在較長時期的發(fā)展趨勢或季節(jié)變動,反映計劃的執(zhí)行情或進度,反映現(xiàn)象數(shù)量間的相互依存關系,反映總體中各單位間分組分配狀況,反映現(xiàn)象數(shù)量在地區(qū)上的分布狀況,反映現(xiàn)象數(shù)量在不同時空條件下的對比關系的統(tǒng)計圖,按變量關系分,統(tǒng)計圖的制圖規(guī)則,明確制圖目的,根據(jù)統(tǒng)計資料的性質和特點,突出重點,選擇合適的統(tǒng)計圖形 統(tǒng)計圖的設計和繪制要保持嚴格的科學性與藝術性,簡明扼要,道俗易懂,圖形布局合理 圖示資料應完

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論