版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、2016.07.27(天津),Fuzhong Xue (薛付忠)山東大學 公共衛(wèi)生學院 生物統(tǒng)計學系Department of Biostatistics, School of Public HealthShandong University,中國生物統(tǒng)計2016年學術年會導師講壇(天津),觀察性研究中的因果推斷方法(三)(30分鐘),觀察性研究中的偏倚及控制策略,-----in the Perspective of Causal
2、 diagram,2,Outline,3,,Statistical Association,偏倚及其來源,4,,Definitions of bias,偏倚及其來源,5,,Definitions of bias,偏倚及其來源,6,,The soureces of biases,選擇偏倚,信息偏倚,混雜偏倚,偏倚及其來源,7,,選擇偏倚( selection bias )及其控制,選擇偏倚:是由于選入的研究對象與未選入的研究對象在某些特征
3、上存在差異而引起的誤差;這種偏倚常發(fā)生于研究的設計階段,是指不同類型(暴露或結局的特征)的研究對象入選的機會不同。 選擇偏倚包括:包括入院率偏倚(Berkson偏倚)、現(xiàn)患病例-新發(fā)病例偏倚(Neyman偏倚)、檢出征候偏倚、無應答偏倚、時間效應偏倚等等類型。,選擇偏倚及其控制,Selection bias can cause an overestimate or underestimate of the association.,8
4、,,選擇偏倚( selection bias )的來源,選擇偏倚及其控制,Selection bias can occur in several ways:Selection of a comparison group ("controls") that is not representative of the population that produced the cases in a case-control
5、 study. (Control selection bias) Differential loss to follow up in a cohort study, such that the likelihood of being lost to follow up is related to outcome status and exposure status. (Loss to follow-up bias) Refusal,
6、 non-response, or agreement to participate that is related to the exposure and disease (Self-selection bias) Using the general population as a comparison group for an occupational cohort study ("Healthy worker"
7、; effect) Differential referral or diagnosis of subjects,9,,選擇偏倚及其控制,比較組(G1,G2)存在很高的選擇效應,由于對E →[ S] ← D中S施加條件(選擇),開放了偏倚路E......D。其后果是被選擇樣本的效應(RR1)與未入選樣本的效應(RR0)不等(RR1 ≠ RR0 ),RR1缺乏總體人群(RRP)的代表性。 選擇偏倚的特點: 1)難以通過調整而消除
8、其影響。 2)需要在設計階段消除。 3)影響E →D的因果推斷。,選擇偏倚的因果圖模型,10,,選擇偏倚( selection bias ),舉例:在HIV陽性者中,懷孕是否影響到發(fā)展為艾滋病的進程的觀察性研究中,研究者希望知道新懷孕對HIV陽性者發(fā)展為艾滋病的時間效應。如果該研究在產(chǎn)前保健診所進行,則懷孕和新診斷為艾滋病這二個事件均可影響去診所就診的幾率(新懷孕者更易于就診,而診斷為艾滋病者也影響就診機會),這樣證明懷孕與發(fā)展
9、為艾滋病之間關系就會收到選擇偏倚的影響。,選擇偏倚及其控制,11,,選擇偏倚及其控制,12,,信息偏倚( Information bias ),信息偏倚:又稱觀察偏倚、錯誤分類偏倚或測量偏倚,是由于測量(疾病、暴露)不準確,診斷標準不明確以及原始記錄不完整等原因所造成的偏倚。包括:(1)回憶偏倚:由于研究對象不能準確、完整地回憶以往發(fā)生的事情和經(jīng)歷時所產(chǎn)生的差異。 (2)報告偏倚:由于研究對象有意擴大或縮小某些信息造成的偏
10、倚。它與回憶偏倚是不同的。 (3)診斷懷疑偏倚:由于研究者和被研究者事先了解被研究者的暴露或分組情況,懷疑被研究者已經(jīng)患病,或希望出現(xiàn)陽性結果,因而在診斷或分析時做出帶傾向性的判斷而造成的偏倚。 (4)暴露懷疑偏倚:研究者事先了解研究對象的患病情況或結局,可能會對其使用與對照組不可比的方法探尋認為與某病或結局有關的因素,而對同一組研究對象以不同的方法調查。這樣,結果會出現(xiàn)很大差異。 (5)測量偏倚:是
11、指對研究所需指標或數(shù)據(jù)進行測量時產(chǎn)生的偏倚。,信息偏倚及其控制,13,,信息偏倚及其控制,信息偏倚( Information bias )——回憶偏倚,14,,Correct Classification VS. Misclassification(錯分偏倚),信息偏倚及其控制,15,,信息偏倚及其控制,,信息偏倚及其控制,信息偏倚的因果圖模型,,信息偏倚及其控制,信息偏倚的因果圖模型,,信息偏倚及其控制,信息偏倚的因果圖模型,,信息
12、偏倚及其控制,信息偏倚的因果圖模型,20,,混雜偏倚( confounding bias ),混雜因子亦稱混雜因素或外來因素,是指與研究因素和研究結局均有關,若在比較的人群組中分布不勻,可以歪曲(掩蓋或夸大)因素暴露與結局之間真正聯(lián)系的因素?;咎攸c是:① 必須是所研究結局的獨立危險因子;② 必須與研究因素(暴露因素)有關;③ 一定不是研究因素與研究結局(疾?。┮蚬溕系闹虚g變量。具備這幾個條件的因素,如果在比較的人群組中分布不均,即
13、可導致混雜偏倚產(chǎn)生。,例如,人群中觀察到肺癌患者往往指甲發(fā)黃,研究假設為:黃指甲是肺癌的危險因素? 此時,吸煙就是研究假設的一個混雜因素。,混雜偏倚及其控制,,,控制混雜偏倚的基本方法——設計階段:,21,隨機化分配( Randomization ),混雜偏倚及其控制,,,控制混雜偏倚的基本方法——設計階段:,22,隨機化分配——有效范圍,E,混雜偏倚及其控制,23,Qi Y, Fan J, Liu J, Wang W, Wang M
14、, Sun J, Liu J, Xie W, Zhao F, Li Y, Zhao D.Cholesterol-overloaded HDL particles are independently associated with progression of carotid atherosclerosis in a cardiovascular disease-free population: a community-based coh
15、ort study.J Am Coll Cardiol. 2015 Feb 3;65(4):355-63.,升高血清HDL的藥物(CETP),控制混雜偏倚的基本方法——設計階段:,隨機化分配——理解病理生理機制的重要性,混雜偏倚及其控制,,,控制混雜偏倚的基本方法——設計階段:,24,隨機化分配——理解病理生理機制的重要性,混雜偏倚及其控制,,,控制混雜偏倚的基本方法——設計階段:,25,限制( Restriction ),研究受教育水
16、平對記憶力的影響時,兒童認知能力是一個混雜因子,此時可以選擇認知能力相同的兒童,此時由于將混雜限制在了固定水平,從而實現(xiàn)對其控制。,(C),(E),(D),選擇認知能力相同的兒童,,(C),(E),(D),S,混雜偏倚及其控制,,,L和E通過兩條路L→S←E和L→E而有向相連(d-connected), 然而,在配對設計中L與E是相互獨立的。在L→S←E中,由于對S施加條件而導致L與E相關,但方向與 L→E的相關相反而相互抵消,保證
17、L與E在匹配亞隊列中仍獨立。因而,匹配并未產(chǎn)生混雜,不必要調整。,26,控制混雜偏倚的基本方法——設計階段:,匹配( Matching )——在隊列設計中匹配,引自: Mansournia MA. Int J Epidemiol. 2013;42(3):860-9.,混雜偏倚及其控制,,,右圖是匹配混雜因子C的匹配病例對照設計。C對D的作用通過C → D、C → E → D、C....D(是有C →[ S] ← D形成的碰撞偏倚路)而有
18、向連接。匹配混雜因子C后,C在病例組與對照組間相等,故C與D獨立,意味著C → D、C → E → D、C....D三條路的關聯(lián)性之和必定為零。則, C → D與 C....D的關聯(lián)性之和必定不為零;因此,混雜路E ← C → D仍然開放。所以,匹配并不能消除C的混雜作用。不僅如此,由于對C →[ S] ← D中碰撞節(jié)點S施加條件(匹配),還額外引入了碰撞偏倚C....D。,27,引自: Shahar E. Clin Epidemiol
19、. 2012;4:137-44,控制混雜偏倚的基本方法——設計階段:,匹配( Matching )——在病例對照設計中匹配,混雜偏倚及其控制,28,,Relative Risk = (27/75) / (14/81) = 2.1,Smokers,Non-smokers,Relative Risk = (1/25) / (2/50) = 1.0,Relative Risk = (26/50) / (12/31) = 1.3,控制混雜偏倚的
20、基本方法——分析階段:,分層分析( Stratified analysis ),化學物暴露,吸煙,惡性腫瘤,?,混雜偏倚及其控制,,,,U,β3,,(參考文獻: Shahar E. Clin Epidemiol. 2012;4:137-44. ),29,控制混雜偏倚的基本方法——分析階段:,更受青睞的控制方法,混雜偏倚及其控制,,,為了消除混雜L對推斷暴露(A) →結局(Y)的因果效應的影響,采用逆處理概率加權 (IPTW)法,對樣
21、本中每個個體進行加權,以構造出阻斷混雜路L→A后的準樣本人群(Pseudopopulation),然后在準樣本人群中采用邊際回歸模型推斷A → Y。IPTW計算方法為: 當 時,則個體i的權重為:當 時,則個體i的權重為:在縱向設計條件下,穩(wěn)定(stable)的IPIW計算方法為:,D Marginal Structr
22、al Model,Robins JM. Epidemiology. 2000;11(5):550-60.,橫斷面設計(基線),縱向設計(隨訪),Inverse-probability-of-treatment weights (IPTW),,,×,30,控制混雜偏倚的基本方法——分析階段:,混雜偏倚及其控制,,,基于準樣本人群,用各種邊際回歸模型(logistic回歸模型,Cox回歸模型、廣義估計方程、聯(lián)合模型等均可作為邊
23、際回歸模型),估計A →Y的因果效應。例如,采用logistic回歸的邊際結構回歸模型為: 推薦文獻及SAS程序: Douglas Faries, etal. Analysis of Observational Health Care Data Using SAS. SAS Institute,2010,D Marginal Structral Model,Robins JM. Epidemiology. 2000;1
24、1(5):550-60.,橫斷面設計(基線),縱向設計(隨訪),Inverse-probability-of-treatment weights (IPTW),,,×,31,控制混雜偏倚的基本方法——分析階段:,混雜偏倚及其控制,32,控制混雜偏倚的基本方法——分析階段:,混雜偏倚及其控制,,,33,An example: Statins, Cholesterol, and Colorectal Cancer,Mamtani
25、R, et al. Disentangling the Association between Statins, Cholesterol, and Colorectal Cancer: A Nested Case-Control Study. PLOS Medicine, April 26, 2016,混雜偏倚控制方法的正確應用,普遍存在的表2謬誤,,,在人群觀察性研究的醫(yī)學論文中,通常用兩個表報道研究結果。 1)在表1中,通常
26、描述和比較暴露組與對照組(或病例組與對照組)人群的人口學、社會經(jīng)濟、臨床特征。 2)在表2中,通常報告多元回歸模型(如多元線性回歸、Logistic 回歸、Cox回歸等)調整協(xié)變量后的關聯(lián)分析結果,展示主要變量在調整了次要變量后對結局的影響。,34,Westreich D, Greenland S. Am J Epidemiol. 2013;177(4):292-8.,條件logistic 回歸模型:,混雜偏倚控制方法的正確
27、應用,,,35,An example: Statins, Cholesterol, and Colorectal Cancer,Association between Hyperlipidemia and Colorectal Cancer,Mamtani R, et al.. PLOS Medicine, April 26, 2016,混雜偏倚控制方法的正確應用,,,36,An example: Statins, Cholestero
28、l, and Colorectal Cancer,Association between Hyperlipidemia and Colorectal Cancer,ORs for association between colorectal cancer risk and total cholesterol measured at different time intervals before colorectal cancerdiag
29、nosis, among statin nonusers (n = 15,052 cases; n = 46,043 controls). Adjusted for obesity (BMI 30 kg/m2), ever smoking, chronic use of aspirin or NSAIDs, hormone replacement therapy, alcohol consumption, diabetes mel
30、litus, performance of bowel screening, and non-statin cholesterol-lowering medication.,Mamtani R, et al.. PLOS Medicine, April 26, 2016,混雜偏倚控制方法的正確應用,,,37,An example: Statins, Cholesterol, and Colorectal Cancer,Associati
31、on between Reduction in Serum Cholesterol and Colorectal Cancer,Mamtani R, et al.. PLOS Medicine, April 26, 2016,混雜偏倚控制方法的正確應用,,,38,An example: Statins, Cholesterol, and Colorectal Cancer,膽固醇水平升高是否一定是導致結直腸癌風險降低的原因?,Mamta
32、ni R, et al.. PLOS Medicine, April 26, 2016,U,U,混雜偏倚控制方法的正確應用,An another example:,混雜偏倚控制方法的正確應用,,,從“流行病學三角”談起(Starting from the “epidemiology triangle),40,混雜偏倚控制方法的正確應用,,,對混雜路上的混雜因子施加條件,可以控制混雜偏倚,圖1中(引自:Hernan MA. Am J Ep
33、idemiol. 2002; 155(2):176-84. ),暴露(E)和疾?。―)有共同原因C,因此C是混雜因子,用粗ORED測量E對D的效應會產(chǎn)生混雜偏倚,對C施加條件可控制混雜偏倚;圖2和圖3中,暴露(E)和疾?。―)的共同原因U(未觀察或不可測量),但在混雜上有已知的混雜因子C,對C施加條件也可以控制混雜偏倚,這是因為對C施加條件后,就阻斷了整個混雜路。,41,混雜偏倚控制方法的正確應用,,,對替代混雜因子施加條件,也可以控制
34、混雜偏倚,圖4中(引自:Hernan MA. Am J Epidemiol. 2002; 155(2):176-84. ),C不是混雜因子U(未觀察或不可測量)的混雜路上的混雜因子,此時,理論上對C施加條件并不能控制混雜因子U。但是,若C與U高度相關,對C施加條件則可以控制混雜因子U;此時C稱為U的替代混雜因子(surrogate confounding) 。,通常情況下,當混雜因子不可測量時,控制其替代混雜因子 可以部分控制混雜偏倚。
35、例如,如果C體現(xiàn)了混雜因子U的錯分,C與U之間的相關性越強,考慮C為一個混雜并對其施加條件就越符合情理。,42,混雜偏倚控制方法的正確應用,,,對因果路上的中介因子施加條件,可能會導致過度調整偏倚,圖5(引自: Schisterman EF. Epidemiology. 2009 ;20(4):488-95 )是一個對中介變量施加條件的簡單因果圖模型。過度調整偏倚(overadjustment bias )是指在估計暴露E對結局D的總效
36、應時,對暴露到結局因果路上的中介變量( intermediate variable )M或中介變量的代理變量( proxy for an intermediate variable )施加條件,而導致的偏倚。 (1)直接對中介變量M施加條件,則產(chǎn)生過度調整偏倚,43,混雜偏倚控制方法的正確應用,,,對因果路上的中介因子施加條件,可能會導致過度調整偏倚,(2)對中介變量的后代代理節(jié)點施加條件,也會產(chǎn)生過度調整偏倚,自然流產(chǎn)史,圖6(引
37、自: Schisterman EF. Epidemiology. 2009 ;20(4):488-95 )是對未測量或觀察的中介變量U的后代代理節(jié)點 (descending proxy for an intermediate variable )M施加條件的例子。此時,使因果路E → U → D部分地被阻塞,而導致過度調整偏倚。在E對D沒有直接效應(βDE=0)時的采用廣義線性模型:,自然流產(chǎn)史,未調整M,調整M,bias=,圖6,βD
38、,βM,目的:估計E對D的總效應。圖6,44,混雜偏倚控制方法的正確應用,,,對因果路上的中介因子施加條件,可能會導致過度調整偏倚,(3)對中介變量的祖先代理節(jié)點施加條件,不會產(chǎn)生過度調整偏倚,圖7(引自: Schisterman EF. Epidemiology. 2009 ;20(4):488-95 )是對未測量或觀察的中介變量U的祖先代理節(jié)點 ( ascending proxy )M施加條件的例子。此時,不會阻塞因果路E → U
39、 → D,故不導致過度調整偏倚。在E對D沒有直接效應(βDE=0)時的廣義線性模型為:,bias=,—,=,未調整M,調整M,則:,目的:估計E對D的總效應。,45,混雜偏倚控制方法的正確應用,,,圖11a~圖11d中(引自:Hernan MA. Am J Epidemiol. 2002; 155(2):176-84. ),暴露(E)和疾?。―)沒有共同原因;在暴露(E)與疾?。―)之間沒有其它的因果路。因此,粗ORED,可以測量E對D
40、的效應。若對碰撞節(jié)點(C)施加條件,反而會導致新的偏倚產(chǎn)生。,對碰撞節(jié)點施加條件,會產(chǎn)生碰撞偏倚(collider-stratification bias),FIG.11a,FIG.11b,FIG.11b3,FIG.11b3,46,混雜偏倚控制方法的正確應用,,,舉例1:對于下圖(引自:Hernan MA. Am J Epidemiol. 2002; 155(2):176-84. )中的F(碰撞節(jié)點)施加條件(例如,分層分析),則會導致
41、E與D之間的假關聯(lián)性,這種偏倚叫做碰撞偏倚。,,,47,混雜偏倚控制方法的正確應用,對碰撞節(jié)點施加條件,會產(chǎn)生碰撞偏倚(collider-stratification bias),,,對混雜路上的碰撞節(jié)點施加條件,會開放新的混雜路而增加新混雜偏倚 舉例2:對于下圖中混雜路E←C→D中的混雜因子C施加條件,由于C也是一個碰撞節(jié)點,則對C施加條件后,開放了新的混雜路E←A......B→D,從而產(chǎn)生了新的混雜偏倚。,,引自:Gree
42、nland S. Epidemiology.1999;10(1):37-48,48,混雜偏倚控制方法的正確應用,對碰撞節(jié)點施加條件,會產(chǎn)生碰撞偏倚(collider-stratification bias),,,不必要對任何變量施加條件而進行調整的情形,(1)不必要調整( Unnecessary adjustment )的基本情形,不必要調整是指在估計E → D的總效應時,對變量進行調整后,不影響總效應的估計,也稱為中性偏倚調整( bi
43、as-neutral adjustment )。以圖9說明不必要調整的幾種類型:1)對完全處于系統(tǒng)外的變量(C1)進行調整;2)對僅作用于暴露(E)的變量(C2)進行調整;3)對不在E → D上的E的后代節(jié)點(C3)進行調整;4)對不在E → D上的D的祖先節(jié)點(C4)進行調整;5)對結局D的后代節(jié)點(C5)進行調整。,引自: Schisterman EF. Epidemiology. 2009 ;20(4):488-95,(
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 30分鐘搞定外科
- 課堂5分鐘積累(30)
- 30分鐘練習倒數(shù)的認識
- 30分鐘決定你的職業(yè).doc
- 30分鐘練會即興伴奏
- 抗心絞痛藥物(30分鐘講稿)
- ptt講師培訓一分鐘三分鐘五分鐘演講題目
- 高一歷史定時訓練(30分鐘)
- ptt講師培訓一分鐘三分鐘五分鐘演講題目
- 三分鐘演講訓練方法
- 三分鐘演講訓練方法
- 解酒的最快方法15分鐘
- 三分鐘即興演講技巧和方法
- 【其他】30分鐘決定你的職業(yè)-32頁
- 10分鐘面試招到核心員工(30頁)
- 1分鐘3分鐘5分鐘十分鐘表盤式倒計時器
- 60分鐘研究
- 普通話考試三分鐘話題作文30篇
- 2023屆高三英語每日一練(30分鐘)(16)
- 感恩的演講稿三分鐘三分鐘演講稿
評論
0/150
提交評論