版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、第十三章 醫(yī)學統(tǒng)計學方法的基本概念和基本步驟,2,醫(yī)學統(tǒng)計學的學習要求:,理解基本的統(tǒng)計原理正確選擇、運用統(tǒng)計分析方法培養(yǎng)基本的統(tǒng)計思維能力,不要求: 公式的推導和記憶、 復雜的手工計算,,教材:預防醫(yī)學 施榕主編內容:第十三章 醫(yī)學統(tǒng)計學方法的基本概念和基本步驟第十四章 數(shù)值變量的統(tǒng)計描述第十五章 數(shù)值變量的統(tǒng)計推斷第十六章 分類變量的統(tǒng)計描述第十七章 分類資料的統(tǒng)計推斷 第十八章 秩和檢驗
2、第十九章 直線相關與回歸分析第二十一章 統(tǒng)計表和統(tǒng)計圖,本節(jié)主要內容,第一節(jié) 統(tǒng)計學的幾個基本概念第二節(jié) 醫(yī)學統(tǒng)計工作的基本步驟,一、什么是醫(yī)學統(tǒng)計學?,例1:比較兩種療法對活動期十二指腸球部潰瘍。一組:口服呋喃硝銨,有效率90%;另一組:口服西咪替丁,有效率85%問:能否立即下結論,呋喃硝銨療效高于西咪替???,醫(yī)學統(tǒng)計學:應用概率論和數(shù)理統(tǒng)計的基本原理和方法,研究醫(yī)學領域中數(shù)據(jù)的收集、整理和分析的一門應用性學科。 是指
3、導人們如何對科研問題進行嚴密的設計、獲取可靠的數(shù)據(jù)、正確的歸納、分析與推理判斷的科學,幫助揭示疾病或現(xiàn)象的發(fā)生、發(fā)展規(guī)律,為預防疾病、促進健康提供客觀依據(jù)。,二、為什么要學統(tǒng)計學?,1. 采用統(tǒng)計學方法,發(fā)現(xiàn)不確定現(xiàn)象背后隱藏的規(guī)律。 變異(variation):是社會和醫(yī)學中的普遍現(xiàn)象。 變異使得實驗或觀察的結果具有不確定性,如每個人的身高、體重、血壓等各有不同。,2.用統(tǒng)計學思維方式考慮有關醫(yī)學研究中的問題 “陽性
4、”結果是否是虛假聯(lián)系? 某感冒藥治療1周后,治愈率為90%,能否說該感冒藥十分有效? “陰性”結果是否是樣本含量不足? 有人曾對發(fā)表在Lancet, N Engl J Med,JAMA等著名醫(yī)學雜志上的71篇陰性結果的論文作過分析,發(fā)現(xiàn)其中有62篇( 93%)可能是由于樣本含量不足造成的假陰性。,3. 保證你的研究論文能通過統(tǒng)計學審查 據(jù)國外60~80年代對不同醫(yī)學雜志發(fā)表論文的調查結果顯示,有統(tǒng)計錯誤的論文所
5、占比例高達72%,最低也有20%。國內1984年對《中華醫(yī)學雜志》、《中華內科雜志》、《中華外科雜志》、《中華婦產(chǎn)科雜志》、《中華兒科雜志》595篇論文的調查結果,相對數(shù)誤用為11.2%,抽樣方法誤用15.9%,統(tǒng)計圖表誤用11.7%。某研究者1996年對4586篇論文統(tǒng)計(中華醫(yī)學會系列雜志僅占6.9%),數(shù)據(jù)分析方法誤用達55.7%。,JAMA,新英格蘭醫(yī)學雜志(NEJM)、英國醫(yī)學雜志、中華醫(yī)學會雜志對來稿都有統(tǒng)計學要求或統(tǒng)計
6、學指導。國際生物醫(yī)學雜志編輯協(xié)會在其《生物醫(yī)學期刊投稿的統(tǒng)一要求》中也包含了統(tǒng)計學要求。 Uniform Requirements for Manuscripts Submitted to Biomedical Journals http:// www.acponline.org,第一節(jié) 統(tǒng)計學的幾個基本概念,一、 總體和樣本,總體:是指根據(jù)研究目的確定的性質相同的觀察單位的全體。
7、 更確切地說,是同質的所有觀察單位某項觀察值(變量值)的集合。,population and sample,,,觀察單位(observation unit): 統(tǒng)計研究中的最基本單位,可以是一個人、一個家庭、一個地區(qū)、一個樣品。,同質:是指除了實驗因素外,影響被研究指標的非實驗因素相同。即研究對象的性質相同。變異:是指在同質的基礎上,被觀察個體之間觀察指標的差異。,同質和變異,homogeneity and variat
8、ion,例1 調查2007年上海市7歲男童的身高和體重 同質:2007年、上海市、7歲男童 變異:身高和體重各不相同例2 研究某降壓藥的療效 同質:高血壓患者、用某藥治療 變異:療效各不相同,同質和變異,總體和樣本,研究目的,總 體,該地2002年全部正常成人的白細胞數(shù),觀察單位,每個正常成人,變 量 值,每人測得的白細胞數(shù),研究某地2002年正常成人白細胞數(shù),,,,,同質基礎:
9、同一地區(qū)、同一年份、同為正常人、,,有限總體,例如:研究用珍菊降壓片高血壓患者治療后的療效同質基礎:同為高血壓患者、同用珍菊降壓片治療總體:包括設想用該藥治療的所有高血壓患者的治療效果 這個結果沒有時間和空間的限制,觀察單位數(shù)無限,無限總體,,,無限總體,有限總體:總體中所包含的個體數(shù)目是可以掌握的,有空間、時間的限制。 無限總體:沒有具體的空間、時間的限制,所包含的個體數(shù)目是未知的。(設想的、或抽象的),有限
10、總體和無限總體,調查某地2002年正常成人的白細胞數(shù) —— 總體從某地2002年正常成人隨機抽取150人,分別測其白細胞數(shù),組成樣本?!?樣本,,總體,,樣本,抽取部分觀察單位,統(tǒng)計量,參 數(shù),,,推斷inference,樣本: 是從總體中隨機抽取的具有代表性的一部分觀察單位其某項指標的實測值的集合。抽樣(sampling):從總體中抽取部分個體的過程。樣本含量(sample size) :樣本包含的觀察單位的數(shù)稱為樣本含
11、量、樣本大小或樣本例數(shù),如何正確地由樣本反映總體呢?,抽樣時必須遵循隨機化原則,隨機性: 總體中每個個體都有相同的機會被抽取到樣本隨機不等于隨意隨機抽樣的實現(xiàn):隨機數(shù)字表,,參數(shù)和統(tǒng)計量,parameter and statistic,參數(shù):根據(jù)總體個體值計算出來的描述總體特征的的指標。 希臘字母表示:如總體均數(shù)μ、總體標準差σ、總體率π等。是固定的常數(shù) 但一般未知。普查,統(tǒng)計量:根據(jù)樣本個體值計算出來的描述樣本特征
12、的指標拉丁字母表示:如樣本均數(shù)、樣本率p等。在參數(shù)附近隨機波動。抽樣調查,,由于抽樣所引起的樣本統(tǒng)計量與總體參數(shù)之間的差異稱為抽樣誤差。產(chǎn)生的原因: 1.個體之間存在變異 2.抽樣時只能抽取總體中的一部分作為樣本 不可避免 但有一定的分布規(guī)律,可估計;并在一定范圍內控制抽樣誤差,二、抽樣誤差( random sampling error):,,三、變量及其分類,實驗或調查研究中的觀察指標稱為隨機
13、變量(random variable);變量的觀測值稱為變量值(variable value)或觀察值(observed value)由變量值構成資料(data),根據(jù)變量值是否定量可分為數(shù)值變量(numerical variable):計量資料分類變量(categorical variable):無序分類變量(unordered categorical variable )計數(shù)資料有序分類變量(ordinal catego
14、rical variable ) 等級資料,25,,1. 計量資料(measurement data):定義:用定量方法對觀察單位準確測量后所得的資料。 變量值是定量的,表現(xiàn)為數(shù)值大小 ,多有度量衡單位。特點: 有度量衡單位 多為連續(xù)性資料 例如:身高(cm)、體重(kg) 血壓(mmHg)、脈搏(次/分) 紅
15、細胞計數(shù)(1012/L),,26,,2.計數(shù)資料(enumeration data)定義:用定性的方法得到的資料。 按觀察單位某種性質或特征分組后,再分別清點各組觀察單位的個數(shù)。 變量表現(xiàn)為互不相容的類別或屬性特點:沒有度量衡單位 多為間斷性資料 例如:膚色(黑、白)——二項分類 血型(ABO)——多項分類
16、 職業(yè)(工農(nóng)兵)——多項分類 性別(男女) ——二項分類,,3.等級資料 (ranked data) 定義:將觀察單位按某種屬性的不同程度分成等級后分組計數(shù)所得的資料。 是介于計量資料和計數(shù)資料之間的一種資料特點:其變量值具有半定量性質 表現(xiàn)為等級大小或屬性程度例如: ①癌癥分期:早、中、晚。 ②藥物療效:治愈、好轉、無效、死亡。
17、 ③尿蛋白: ?,?,?,++,+++及以上,,實例數(shù)據(jù)1,,實例數(shù)據(jù)2,,4. 三類資料間關系,例:一組20?40歲成年人的血壓,以12kPa為界分為正常與異常兩組,統(tǒng)計每組例數(shù),<8 低血壓 8? 正常血壓 12? 輕度高血壓 15? 中度高血壓 17? 重度高血壓,計量資料,等級資料,計數(shù)資料,,確定性現(xiàn)象:在一定條件下,一定會發(fā)生或一定不會發(fā)生
18、的現(xiàn)象。其表現(xiàn)結果為兩種事件: 肯定發(fā)生某種結果的叫必然事件; 肯定不發(fā)生某種結果的叫不可能事件。隨機現(xiàn)象:在同樣條件下可能會出現(xiàn)兩種或多種結果,究竟會發(fā)生哪種結果,事先不能確定。隨機事件:在一定條件下某一現(xiàn)象可能發(fā)生也可能不發(fā)生的事件。 隨機事件的特征:①隨機性;②規(guī)律性:每次發(fā)生的可能性的大小是確定的或者可以估計的。,四、概率(probability ),,概率( probability ):是反映某一隨機
19、事件發(fā)生的可能性大小的一個量度,記為P,取值 [0,1]。必然事件:P=1不可能事件:P=0隨機事件:0<P<1P<0.05或P<0.01的隨機事件稱為小概率事件統(tǒng)計學上認為1次抽樣中不大可能發(fā)生。,Certain,Impossible,0.5,0,1,,頻率(frequency) :指樣本的實際發(fā)生率。設在相同條件下,獨立重復進行n次試驗,隨機事件A出現(xiàn)f 次,則事件A出現(xiàn)的頻率為f /n。
20、例如投擲硬幣,歷史上有人對此做過實驗得到如下結果:,頻 率 (frequency ),,頻率與概率間的關系,樣本頻率總是圍繞概率上下波動樣本含量n越大,波動幅度越小,頻率越接近 概率。頻率常用于估計概率:當n→∝時,f /n→ P(A)。,,第二節(jié) 醫(yī)學統(tǒng)計學的基本步驟,設 計:包括觀察性研究設計和實驗性 研究設計2. 收集資料:取得準確可靠的原始資料3. 整理資料:對資料進行清理、改錯,
21、數(shù)量化4. 分析資料:統(tǒng)計描述、統(tǒng)計推斷,,定義:是在保證科學性、可重復性和高效性的前提下,為驗證研究假說而制定周密的醫(yī)學研究計劃。 在廣泛的查閱文獻、全面了解現(xiàn)狀、廣泛征詢意見的基礎上,對將要進行的研究工作所作的全面的設想。,1、設計(design),,1、設計(design)的分類:調查設計(survey design):對研究對象不施加任何干預,通常建立隨機抽樣(random sampling)方案。 搜集資料在整
22、個研究設計中占主要地位.實驗設計(experiment design):對研究對象施加干預,如動物實驗研究、臨床試驗,通常建立隨機分組(random allocation)方案。,,2、設計(design)的內容(1)明確研究目的和研究假說。(2)確定研究對象與觀察單位、樣本含量和抽樣方法。(3)是否施加干預,如何施加干預?如何設置對照?(4)設置觀察指標。(5)需搜集哪些原始資料,用什么方法 ?(6)如何對取得資料作進一
23、步的整理和匯總,計算統(tǒng)計指標。(7)如何控制誤差。(8)預期會得到什么結果。(9)研究進度和經(jīng)費的安排等。,,Fisher 在他的著作中多次強調,統(tǒng)計學家與科學研究者的合作應該在實驗設計階段,而不是在需要數(shù)據(jù)處理的時候?!霸囼炌瓿珊笤僬医y(tǒng)計學家,無異于請統(tǒng)計學家為試驗進行“尸體解剖”。 統(tǒng)計學家或許只能告訴你試驗失敗的原因?!?,2、收集資料(data collection),收集資料:根據(jù)研究目的收集準確、完整的原始資料。
24、資料的來源:1、統(tǒng)計報表:疫情報表、醫(yī)院工作報表等;2、登記和報告卡(單):傳染病和職業(yè)病發(fā)病報告卡,腫瘤發(fā)病及死亡報告卡,出生及死亡報告單等;3、日常醫(yī)療衛(wèi)生工作記錄:如門診病例、住院病例、健康檢查記錄、衛(wèi)生監(jiān)測記錄等4、專題調查或實驗研究:開展醫(yī)學科研的主要資料來源 前三種都有局限性。,,資料收集計劃 ①選擇搜集資料的地點、人員和時間; ②搜集資料人員的培訓方案; ③預調查或預實驗方案擬定;
25、 ④資料的記錄方式; ⑤調查表的擬訂和印刷; ⑥調查或實驗儀器、試劑的準備; ⑦調查資料的抽樣復核比例和方法; ⑧搜集資料所需經(jīng)費的準備等。,,目的是對搜集到的原始資料其系統(tǒng)化和條理化,便于進一步計算統(tǒng)計指標和深入分析。資料整理前要對資料再次檢查與核對,發(fā)現(xiàn)缺項或錯項較多的調查表,須補查或剔除。審查無誤后,設計分組。,3、整理資料(data sorting),資料整理的過程,1、對原始數(shù)據(jù)進行核對和
26、檢查。2、設計分組。(1)質量分組:按屬性或類別歸類分組;(2)數(shù)量分組:按數(shù)值大小分組。3、按分組要求設計整理表,匯總資料。,,可借助于計算機軟件(EpiData, Study -Builder, Excel)來完成。1、編碼,將數(shù)據(jù)輸入計算機2、糾錯改錯、補漏等,,運用統(tǒng)計學的基本原理和方法,根據(jù)研究設計的目的、要求、資料的類型和分布特征選擇正確的統(tǒng)計分析方法,進行一系列的統(tǒng)計描述和統(tǒng)計推斷,揭示事物內部的規(guī)律??山柚?/p>
27、于計算機(常用軟件:SPSS、SAS、STATA)完成。,4、分析資料(data analysis),,4、分析資料(data analysis),統(tǒng)計描述(descriptive statistics) 是指用統(tǒng)計指標和適宜的統(tǒng)計圖、統(tǒng)計表等方法,描述統(tǒng)計資料的分布規(guī)律及其數(shù)量特征。統(tǒng)計推斷(inferential statistics) 是通過隨機樣本信息推斷總體特征的過程。 參數(shù)估計(parameter
28、 estimation) 假設檢驗(hypothesis test),第二十二章 常用統(tǒng)計分析軟件簡介(284頁),一、SPSS(PASW)軟件:二、SAS軟件:統(tǒng)計專業(yè)用戶三、STATA軟件:分析能力強,速度極快! 圖形精美四、EPI INFO:流行病學調查得數(shù)據(jù)管理軟件。,SPSS軟件,美國斯坦福大學研制,目前已被IBM兼并。最新版本19.0.特點:界面友好、使用方便、功能齊
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 市場調研中非抽樣誤差研究.pdf
- 預防醫(yī)學]04抽樣誤差與假設檢驗
- 樣本1同一總體差異抽樣誤差引起
- 公路運輸量抽樣誤差控制研究.pdf
- 詢問法市場調研中的非抽樣誤差研究.pdf
- 基于非抽樣誤差的電力工程調查方法研究.pdf
- 16433.基于抽樣誤差調整的酵母基因轉錄起始位點信號模型
- 慢性乙型病毒性肝炎肝組織活檢標本病理結果抽樣誤差以及不同觀察者閱片的主觀差異性研究.pdf
- 抽樣與抽樣估計
- 簡單隨機抽樣、系統(tǒng)抽樣、分層抽樣
- 實驗四 時域抽樣與頻域抽樣
- 統(tǒng)計學--抽樣與抽樣分布
- 實驗二 時域抽樣與頻域抽樣
- 抽樣論文-對比分析簡單隨機抽樣和整群抽樣
- 抽樣檢驗
- 《抽樣理論》
- 抽樣編號
- 分層抽樣與系統(tǒng)抽樣(導學案)
- 抽樣調查-第5章-不等概抽樣
- 抽樣檢驗材料
評論
0/150
提交評論