2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩62頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、醫(yī)學科研設計與統計學思維,醫(yī)學統計學要說它簡單吧,其實也挺簡單的,常見的統計方法也就十余種,在教科書上都能找到,只要熟練掌握了,雖不敢夸下??谡f可以“以秋風掃落葉的氣概橫掃四海之內的雜志”,但足以輕車熟路地應付一般的科學研究。要說它復雜吧,也挺復雜的,毫不夸張地說,絕大部分國內期刊,甚至在SCI雜志上,亂用統計學的現象多如牛毛。很多人在學習醫(yī)學統計學時,都在抱怨自己很難走出“一學就會,一會就用,一用就錯,一錯就懵”的怪圈。

2、究其原因,主要是我們在學習醫(yī)學統計學時都抱著一副“依葫蘆畫瓢”的態(tài)度,試圖“套用統計學方法”來解決自己面臨的問題,而不去仔細思考統計學方法的本身的特點。,沒有設計的臨床干預試驗 1685年搶救英國國王查理二世(Charles II ,1630-1685): “一品脫(0.568L)血從右臂放出,半品脫血從左肩放出,服下催吐劑、兩付湯藥和一種由15成份的灌腸劑。刮國王的頭部,直到起一個大泡。再服打噴嚏的藥粉和更多的催

3、吐劑。繼續(xù)放血,加服止痛劑。把瀝青和鴿子糞混合后敷于腳上。服一種含有10種成份的草藥。最后服人頭蓋骨粉制成的40滴糖漿,外敷牛黃。然后,國王陛下死了?!?有設計的臨床干預試驗 1747年5月20日,英國的J. Lind醫(yī)生將12名病情相同似的患者帶到一艘船上?;颊叩闹饕Y狀是牙齦潰爛,皮膚有出血點,雙膝無力。Lind將12名患者分為6組,分別給予下列主要干預: A組:每天飲1夸脫(1.136L)蘋

4、果汁; B組:服25滴硫酸丹劑(elixir vitriol),每天3次; C組:服2匙醋,每天3次; D組:每天飲約半品脫海水,服緩和的瀉藥; E組:每天食2個桔子,一個檸檬; F組:每天服由大蒜、芥子等成份組成的干藥。 當6月16日船返回英國Plymouth港時,所有患者的病情都有好轉,其中E組恢復的最快、最好

5、,其中一人到第6天就可以工作了。B組也有一人比登船時健康。Lind醫(yī)生的試驗并沒有得出明確的結論,直到160年后,通過動物實驗才真正從科學意義上解釋了E組療效最好的真正原因。,J.Lind醫(yī)生的研究有二點符合統計學的設計:1、設立了對照(相互對照);2、質量控制(消除了一些混雜)。如果我們今天重復J.Lind的研究,在統計設計的上還需要做到以下幾點:1、研究對象的定義與納入標準和排除標準2、足夠多的觀察對象3、效應指標的選

6、擇4、結論是否能外推,統計學方法用于干預試驗 1835年,法國醫(yī)生P.C.A. Louis 對當時流行的“放血”療法治療肺炎的效果進行了比較,發(fā)現“放血”的療效不象預期的那么好,而且早期“放血”和晚期“放血”組比較,患者的診斷、病情、病程、年齡等方面的差異很大,比較平均治愈時間意義不大。因為晚期“放血”組的平均治愈時間長,但該組患者病情重、病程長、年齡大。 Louis對醫(yī)學研究的方法學作出了很大貢獻:

7、 (1)用數字的方法表示不同疾病患者的特征和預后; (2)提出了臨床療效對比的前瞻性原則; (3)提出抽樣誤差和混雜(confounding)概念。其中前瞻性研究和減少混雜,分別成為當今臨床試驗和流行病學研究的基本研究方法; (4)在J. Gavarret 的協助下,Louis的數字方法發(fā)展為“概率框架”,Gavarret也于1840年在巴黎出版了世界第一部醫(yī)學統計學教科書。,“非常痛心地看到,因為

8、數據分析的缺陷和錯誤,那么多好的生物研究工作面臨著被葬送的危險” F. Yates,M.J.R. Healy,醫(yī)學論文中的統計問題 統計知識的運用 撰寫論文:報告自己觀察或實驗的研究結果 閱讀論文:吸收新知識,了解學術進展 1996年,對申報科技成果的4586篇科研論文分析,統計方法使用率為76%。 醫(yī)學論文中統計運用

9、錯誤,除了影響論文的科學性,還可能導致嚴重的倫理學問題。,“調查結果反映了醫(yī)學論文作者統計知識和統計水平的低下,也再次強調了生物統計學者不是令人生畏的檢查官。恰恰相反,生物統計學者是我們的可貴盟友。生物統計學不是遠離我們的數學,而是現代醫(yī)學的一門基本學科,就像大廈中的一個支柱” ---JAMA的編輯部,60年代到80年代,國外醫(yī)學雜志調查結果:有統計錯誤的論文20%~72%。1984年對《中華醫(yī)學雜志》、《中華內科雜志》、《中華外科雜

10、志》、《中華婦產科雜志》、《中華兒科雜志》595篇論文的調查結果: 相對數誤用為11.2% 抽樣方法誤用15.9% 統計圖表誤用11.7%1996年對4586篇論文統計(中華醫(yī)學會系列雜志占6.9%),數據分析方法誤用達55.7%。,科學容不得半點虛假,造假者一旦

11、被揭露就背上了永遠洗脫不掉的恥辱 。,偽造統計數據違反科學道德 據1976年New Science 雜志關于科研舞弊行為的調查74%的調查表反映有不正當修改數據的情況,其中,17%拼湊實驗結果,7%憑空捏造數據,2%故意曲解結果。 就統計學本身來說,正確實驗設計得出的統計結果,是用P值作為“重現性”的概率保證。P<0.05,就是說實驗結果顯示的差別是機遇所致的可能性不足5%,或者說,別人在同樣的條

12、件下重復同樣的試驗,得出相反結論的可能性不足5%。,統計推斷,統計推斷 statistical inference,如:樣本均數 樣本標準差S 樣本率 P,如:總體均數 總體標準差 總體率,內容:參數估計(estimation of parameters) 包括:點估計與區(qū)間估計2. 假設檢驗(test of hypothesis),統計推斷,抽

13、樣誤差,如:樣本均數 樣本標準差S 樣本率 P,如:總體均數 總體標準差 總體率,,抽樣誤差 (sampling error) :由于個體差異導致的樣本統計量與總體參數間的差別。,統計的結論是推斷而不是證明,正確的統計結論必須建立在科學的設計和合適的統計方法上,否則得到是不恰當或是錯誤的結論。 1、收集數據的方法(研究假說、調查或實驗設計、誤

14、 差和偏倚的控制等) 2、分析數據的方法(變量的類型、數據的分布、研究 目的和因素等) 3、結論的外推(統計結論是否適合所有研究對象),1. 采用統計學方法,發(fā)現不確定現象背后隱藏的規(guī)律。 變異(variation)是社會和生物醫(yī)學中的普遍現象。 變異使得實驗或觀察的結果具有不確定性,如每個人的身高、體重、血壓等各有不同。,一、為什么要學統計學?,,最大值=6.18, 最小值=3.2

15、9, 極差=2.89。 算術均數=4.72,標準差=0.57。,案例一:兩個指標診斷疾病的問題路人甲做了一個研究,旨在比較兩個指標(A和B)對肝癌的診斷價值。路人甲以A和B的參考范圍上限作為診斷界值,得出了A和B在該界值下對應的診斷敏感性和特異性。結果表明,A的診斷敏感性為0.80,特異性為0.90;B的診斷敏感性為0.85,特異性為0.87。路人甲很快撰寫論文報道了自己的研究成果,指出B診斷肝癌的敏感性高于A,而特異性低于A。&#

16、160;路人乙是這篇文章的審稿人,當他看見這個結論后,毫不猶豫地在審稿意見中寫道:就敏感性而言,B高于A;就特異性而言,A高于B。診斷敏感性和特異性與所采用的界值密切相關,作者得出的敏感性和特異性僅僅代表了一個診斷界點下面的診斷效能,無法從全局上反映A和B的診斷價值。文章的結論到底是想說明A優(yōu)秀還是B優(yōu)秀呢Reject!這個例子說明:統計指標選錯了,統計出來的東西往往難以“自圓其說”。,稿件被退了,路人甲有些許郁悶。經過認真學習科研

17、設計與統計學知識后,路人甲終于明白了一個問題:兩個指標診斷性能的比較是不能比較敏感性和特異性的,而應該比較ROC的曲線下面積,因為曲線下面積才是衡量整體診斷效率的最佳指標。路人甲很快繪制了ROC曲線,統計結果表明,A的曲線下面積為0.80,B的曲線下面積為0.82。路人甲欣喜若狂,趕緊動筆寫論文,并且理直氣壯地給文章定了一個結論:B的診斷效率是優(yōu)于A的,其理由就是因為B的曲線下面積大于A。 路人丙是這篇文章的審稿人,當他看見

18、這個結論后,臉色鐵青,毫不猶豫地在審稿意見中寫道:從表面上看,B的曲線下面積高于A,但是導致這種差異的原因有兩種,一種是隨機誤差,一種是試驗效應,即B確實是高于A的。你怎么能確定這不是抽樣誤差呢?在統計學上,要確定0.82是否高于0.80,就一定要經過統計學檢驗的。又Reject! 這個例子說明:在醫(yī)學科研中,沒有經過統計學檢驗的結論雜志社多半認為是不科學的。,稿件又被退了,路人甲很是郁悶。他吸取了經驗教訓,自學了很多統計

19、學理論,終于弄清楚了采用何種方法去比較曲線下面積。接下來的事情就是改稿,然后另選雜志繼續(xù)投稿。路人甲在文稿中特別注明了,曲線下面積是經過了統計學檢驗的,B的曲線下面積(0.82)與A的曲線下面積(0.80)之間的差異是有統計學意義的,而且還大搖大擺地在后面加了個括號,寫明P=0.01。路人甲仰天長嘆了一口氣,很鄭重地給自己的研究下了結論:本研究表明B的診斷效率是優(yōu)于A的。 路人丁是這篇文章的審稿人,當他看見這個結論后,臉色鐵

20、青,毫不猶豫地在審稿意見寫道:B是常見的診斷指標,其檢測結果并不對臨床醫(yī)師設盲,在很大程度上可以檢測影響臨床醫(yī)師對疾病的診斷。A是新進發(fā)現的診斷指標,其結果完全對臨床醫(yī)師設盲,不可能影響醫(yī)生的診斷。所以作者的結論(B比A優(yōu)秀)是不可靠的。再說得通俗點,如果把A和B分別理解成法庭上的原稿和被告,那B無疑既充當了辯護律師,又充當了法官的角色。在這種情況下,A輸掉了官司是十分正常的。如果換一個公平的、獨立的法官來斷案,B能否勝出就不好說了。再

21、一次Reject! 這個例子說明:實(試)驗設計有缺陷,即便是統計學方法準確也于事無補。,稿件又一次被退了,路人甲的心情極度郁悶。思來想去,決定把實驗重做一遍,讓A和B在一個公平的環(huán)境中比較(為便于描述,此處忽略醫(yī)學倫理學問題)。在新開展的研究中,A和B都是對臨床醫(yī)生設盲的,不可能影響金標準。這下A和B的比較結果應該比較可靠了吧,路人甲又仰天長嘆了一口氣,感覺自己如釋重負了??蒲刑垓v人了,太不容易了!統計結果很快出來,A的

22、曲線下面積是0.80,B的曲線下面積則變成了0.77,經過統計學檢驗后發(fā)現,A的診斷效能確實是高于B的。整個研究的試驗設計滴水不漏,統計學過程天衣無縫,我就不信還有人敢拒這篇稿件,路人甲心中開始暗喜。,路人戊是這篇文章的審稿人,當他看見這個結論后,臉色鐵青,毫不猶豫地在審稿意見寫道:A和B的檢測并不矛盾,他們之間的關系不應該是競爭關系,而應該是合作關系。讀者最關心的問題顯然不是A和B“孰強孰弱”的問題,雖然這個問題有一定的專業(yè)價值。如果

23、我是坐診醫(yī)生,我會說:A和B誰強誰弱關我什么事?總之來一個病人我就A和B都檢測,我的患者都不差錢!作者的研究重點應該是明確A和B能否互補,聯合使用是否能有助于提高診斷準確性的問題,而非A和B“孰強孰弱”的問題。簡單地說,就是明確1+1是否大于1的問題。還是被Reject!(作者吐血),這個例子說明:研究方向錯了,即使是無懈可擊的實(試)驗設計和天衣無縫的統計方法,也是無濟于事。,這四個例子說明:醫(yī)學科研是很痛苦的,不重視統計學和科研設計

24、,會走很多彎路的。,2. 用統計學思維方式考慮有關醫(yī)學研究中的問題 “陽性”結果是否是虛假聯系? 某感冒藥治療1周后,治愈率為90%,能否說該感冒藥十分有效? 以前的許多研究表明,血清甘油三酯的含量與冠心病危險性有關,即甘油三酯的含量越高,患冠心病的危險性就越大。有的醫(yī)生以此篩選危險人群?,冠心病,甘油三酯,膽固醇+ 高密度脂蛋白,,,,,,,虛假聯系,案例二,如何看待統計學結果路人甲經歷數十年的

25、研究,動用了各種高精尖的研究手段,發(fā)現了一個新的蛋白(命名為蛋白A)。在肝癌患者中展開的研究表明,蛋白A和甲胎蛋白(AFP)有很好的相關性,其相關程度之好,幾乎可以用“一塌糊涂”來形容,相關系數達到了0.99(P<0.0001)。路人甲欣喜若狂,盡管蛋白A的檢測過程還十分繁瑣,檢測費用還十分高,但是路人甲還是把持不住內心的激動,日夜兼程地撰寫論文,宣稱自己找到了一個新的肝癌標志物。 路人乙是這篇文章的審稿人,當他看見這

26、個結論后,臉色鐵青,毫不猶豫地在審稿意見寫道:統計結果表明蛋白A和AFP的相關性十分明顯。如果是這樣,在臨床實踐中,通過檢測AFP完全就可以得知蛋白A的濃度了,蛋白A在肝癌中的臨床價值完全可以被AFP代替,還不說蛋白A的檢測過程繁瑣,費用太高的問題,你說蛋白A還有什么價值? Reject!,這個例子說明:統計學陽性的結果未必是“好結果”。,,如:當專業(yè)上有一定聯系的兩個變量之間的變化呈“S型”或“倒S型”曲線趨勢時,若錯誤地用直線方程去

27、描述,從統計學角度看效果也很好,但在專業(yè)上是解釋不通的。再比如,某兩個統計量(如均值、率等)之間的差別在統計學上有顯著性意義,有時在專業(yè)上并無實用價值。如某種新的降壓藥,平均降低血壓 2 mmHg,若樣本含量較大,誤差又較小,統計檢驗可能會得到“P<0.05”的結果,但在臨床上卻認為此新藥的療效沒有多大提高。另外,在運用統計學中,稍有不慎都可能犯這樣或那樣的錯誤。因此,統計結論的可靠性仍需通過實踐去檢驗。所以,應當牢記:運用統計學時

28、必須結合醫(yī)學實際,才能真正發(fā)揮統計學應有的作用。,有統計學(差異)意義,并不代表有生物學、臨床意義,案例三,降糖藥的研究、學生自殺事件某醫(yī)生長期從事降糖藥的研究,最近他發(fā)現了一種藥物,可以降低患者的血糖。為了評價該藥的降糖效果,路人甲費盡心機地設計了一個看似完美的隨機對照試驗(RCT),為了保證結果可靠,路人甲嚴格遵守RCT設計準則,包括隨機、雙盲、安慰劑對照等措施。研究結果表明,實驗組和對照組在接受藥物治療前血糖濃度的均值都是10m

29、mol/L,差異無統計學意義,表明兩組研究對象的基線特征具有可比性。對照組未經任何藥物治療(為便于描述,此處忽略醫(yī)學倫理學問題),血糖濃度還是10mmol/L;實驗組經過藥物干預后,血糖濃度變成了9mmol/L,統計學檢驗結果表明,實驗組和對照組治療后的血糖濃度的差異是有統計學意義的(P<0.01)。路人甲趕緊撰寫論文,并毫不客氣地給研究下了個結論:該藥可以降低患者血糖。,路人乙是這篇文章的審稿人,當他看見這個結論后,臉色鐵青,毫

30、不猶豫地在審稿意見寫道:卻要確實可以降低血糖,但是一個只能降低1mmol/L的降糖藥有何臨床價值?Reject! 這個例子說明:有統計學意義不一定有專業(yè)意義。,某CDC做了一個調查,同處一地的A和B兩所中學,各有1000名學生,過去的一年,A校有5名學生自殺(自殺率為0.5%),B校沒有學生自殺(自殺率為0%)。統計學結果表明,兩校自殺率的差異無統計學意義(P=0.07,Fisher確切概率法)。于是寫論文得出結論:A和B

31、兩校的自殺率是沒有統計學上的差異,A校5名學生自殺純屬小概率事件。路人乙是這篇文章的審稿人,當他看見這個結論后,臉色鐵青,毫不猶豫地在審稿意見寫道:5個鮮活的生命就這樣沒有了,5個家庭就這樣毀了,你卻告訴我這純屬小概率事件,你就不怕“人神共憤”嗎?Reject! 這個故事說明:有專業(yè)意義不一定有統計學意義。,這兩個故事說明:統計學只是方法學,醫(yī)學科研中需要借助統計學方法來發(fā)現事物的規(guī)律性,但不能死磕統計。,例:某醫(yī)生用一種

32、新的治療某病的療法(簡稱治療組),用現在公認的療法作為對照(簡稱對照組),經臨床試驗,對照組和治療組的療效分別為P1=75%與P2=95%。問:能認為這兩個有效率之間的差別有顯著性意義嗎?答:這兩個有效率之間的差別可能有統計學意義,也可能沒有統計學意義。因為其結論不僅取決于二者之差的絕對值大小,更主要的是取決于隨機誤差的大小和樣本大小,千萬不可輕率地作出統計推斷?,F假定這兩個有效率分別來自下列甲、乙、丙三批實驗的結果,則具有下列3種不同

33、的統計檢驗結果。,“陰性”結果是否是樣本含量不足? 有人曾對發(fā)表在Lancet, N Engl J Med,JAMA等著名醫(yī)學雜志上的71篇陰性結果的論文作過分析,發(fā)現其中有62篇( 93%)可能是由于樣本含量不足造成的假陰性。,表1、兩個有效率的比較,甲實驗中,P1與P2之間的差別無統計學意義(校正χ2 =1.765,P>0.05)乙實驗中,P1與P2之間的差別有統計學意義(χ2=6.275,0.01<P<0.

34、05);丙實驗中,P1與P2之間的差別也有統計學意義(χ2=9.412,P<0.01)。,案例四:路人甲發(fā)明了兩套診斷肺癌的方案,分別命名為A和B。為了明確這兩種方到底誰“更勝一籌”,路人甲找了100個肺癌患者和100個疑似肺癌患者(結核、肺炎等),分別用A、B兩套方案去進行鑒別診斷。在200個研究對象中(100個肺癌和100個非肺癌),方案A正確了100例,準確率50%,方案B僅僅正確了50例,準確率僅為25%??ǚ綑z驗結果:方案A

35、和B準確率之間的差異有統計學意義(P<0.01)。很明顯,方案A的準確性要高于方案B。路人甲趕緊發(fā)表論文,指出:方案A診斷肺癌的準確性優(yōu)于方案B。路人乙是這篇文章的審稿人,當他看見這個結論后,臉色鐵青,毫不猶豫地在審稿意見寫道:如果我(審稿人本人)是坐診醫(yī)生,他就會反著看方案B的結果,凡是方案B認為是肺癌的,他就認為病人不是肺癌;反之亦然。這樣下來,200個病人中,方案B應該能正確識別150個人,準確率為75%,統計學結果表明,

36、方案B的準確率(75%)是高于方案A(50%)的,所以真實的情況是方案B優(yōu)于方案A。實際上,當面對這200名患者的時候,隨便到城隍廟找個瞎子來“算命(猜患者是否患?。?,按照統計學理論,準確率也應該是50%,方案A的價值可以說是“一無是處”。Reject!,這個例子說明:統計學陰性的結果未必是“壞結果”。,3. 保證你的研究論文能通過統計學審查 據國外60~80年代對不同醫(yī)學雜志發(fā)表論文的調查,有統計錯誤的論文的百分比最高

37、達72%,最低也有20%。 國內1984年對《中華醫(yī)學雜志》、《中華內科雜志》、《中華外科雜志》、《中華婦產科雜志》、《中華兒科雜志》595篇論文的調查結果,相對數誤用為11.2%,抽樣方法誤用15.9%,統計圖表誤用11.7%。某研究者1996年對4586篇論文統計(中華醫(yī)學會系列雜志僅占6.9%),數據分析方法誤用達55.7%。,JAMA,新英格蘭醫(yī)學雜志(NEJM)、英國醫(yī)學雜志、中華醫(yī)學會雜志對來稿都有統計學要求

38、或統計學指導。 國際生物醫(yī)學雜志編輯協會在其《生物醫(yī)學期刊投稿的統一要求》中也包含了統計學要求。 Uniform Requirements for Manuscripts Submitted to Biomedical Journals http:// www.acponline.org,《中華醫(yī)學雜志》對來稿中統計學處理的有關要求1.統計研究設計:應交代統計研究設計的名稱和主要做法

39、。如調查設計(分為前瞻性、回顧性或橫斷面調查研究);實驗設計(應交代具體的設計類型,如自身配對設計、成組設計、交叉設計、析因設計、正交設計等);臨床試驗設計(應交代屬于第幾期臨床試驗,采用了何種盲法措施等)。主要做法應圍繞4個基本原則(隨機、對照、重復、均衡)概要說明,尤其要交代如何控制重要非試驗因素的干擾和影響。2.資料的表達與描述:用x 和s表達近似服從正態(tài)分布的定量資料,用M(Q )表達呈偏態(tài)分布的定量資料;用統計表時,要合理安

40、排縱橫標目,并將數據的含義表達清楚;用統計圖時,所用統計圖的類型應與資料性質相匹配,并使數軸上刻度值的標法符合數學原則;用相對數時,分母不宜小于2O,要注意區(qū)分百分率與百分比。3.統計分析方法的選擇:對于定量資料,應根據所采用的設計類型、資料所具備的條件和分析目的,選用合適的統計分析方法,不應盲目套用t檢驗和單因素方差分析;對于定性資料,應根據所采用的設計類型、定性變量的性質和頻數所具備的條件以及分析目的,選用合適的統計分析方法,不應

41、盲目套用χ2 檢驗。對于回歸分析,應結合專業(yè)知識和散布圖,選用合適的回歸類型,不應盲目套用簡單直線回歸分析,對具有重復實驗數據的回歸分析資料,不應簡單化處理;對于多因素、多指標資料,要在一元分析的基礎上,盡可能運用多元統計分析方法,以便對因素之間的交互作用和多指標之間的內在聯系進行全面、合理的解釋和評價。4.統計結果的解釋和表達:當P<0.05(或P<0.01)時,應說明對比組之間的差異有統計學意義,而不應說對比組之間具有

42、顯著性(或非常顯著性)的差別;應寫明所用統計分析方法的具體名稱(如:成組設計資料的t檢驗、兩因素析因設計資料的方差分析、多個均數之間兩兩比較的q檢驗等),統計量的具體值(如t=3.45,X2=4.68,F=6.79等)應盡可能給出具體的P值(如P=0.0238);當涉及到總體參數(如總體均數 總體率等)時,在給出顯著性檢驗結果的同時,再給出95%置信區(qū)間。,還是那個AFP與蛋白A的例子。路人甲發(fā)現蛋白A和甲胎蛋白(AFP)之間有很好的相

43、關性,也開始撰寫論文,但是他的結論并不是“蛋白A是診斷肝癌的標記物”。他認為,既然蛋白A與AFP之間有很強的相關性,那提示AFP和蛋白A之間可能存在十分密切的“調節(jié)”或者“被調節(jié)”關系。最終,路人甲圍繞“蛋白A與AFP之間的調節(jié)或者被調節(jié)關系”做了很多分子生物學試驗,指出蛋白A是調節(jié)AFP表達的唯一(注意“唯一”這兩個字)因子,因此二者之間才會呈現如此強烈的相關性。這是一項基礎研究,雖然未能直截了當地地指出蛋白A的臨床價值,但是這個研究

44、形象生動地講述了一個完整的分子生物學事件,豐富了我們對于肝癌發(fā)生與發(fā)展分子機制的認識。最終,論文“堂而皇之”地accept了。 這個例子說明:同一統計學結果,從不同的專業(yè)角度去解釋,結論是完全不同的。以上所有案例說明:對統計學結果的解讀一定要結合專業(yè)!從專業(yè)中來,到專業(yè)中去!,4. 獲得循證醫(yī)學證據的主要手段“良好愿望的醫(yī)學”(well-meaning medicine)轉入“以證據為基礎的醫(yī)學” (evidence

45、-based medicine,EBM)需要有統計學方法的支持。 全世界的醫(yī)學期刊每年大約刊登600萬學術論文,但能作為可靠“證據”的論文并不多。,二、 醫(yī)學科研的基本要素,醫(yī)學科研由三個基本部分組成,即處理因素(study factor)、受試對象(study object)和實驗效應(experimental effect)。例如,觀察流甲丙脯酸對腎性高血壓患者的療效。其中,疏甲丙脯酸為處理因素,腎性高血壓患者為受試對象,

46、動脈壓變化為試驗效應。通常將這三個組成部分稱為醫(yī)學科研的基本要素。如何正確選擇三個要素,是科研設計的關鍵問題。,Study factor,,Study object,,Experimental effect,,,,1、醫(yī)學研究設計的基本原理:,降壓藥,高血壓病人,血壓值,,,T,,,s,e,T+S=e,基本模式:,T+s1=e1=20mmHg,O+s2=e2=5mmHg,,T-O=e1-e2=20-5,T,,e=15mmHg,,,處

47、理因素的作用被單獨的顯示,統計分析的思維: 在排除或控制了一些可能影響實驗效應的因素后,以概率為基礎計算其差異是否為隨機誤差(偶然性結果),從而推斷處理因素(或暴露)的效應是否不為零。,,,,處理效應,(暴露),(目標人群),(發(fā)病風險),,,處理組:,對照組:,研究假說:處理效應不為零統計假設:處理效應為零,醫(yī)學科研類型由于不同的科研目的,有多種不同的分類方法。如,按科技活動類型分為基礎研究、應用研究和開發(fā)研

48、究(發(fā)展研究);按照醫(yī)學中各專業(yè)的屬性,可分為:基礎醫(yī)學科研、臨床醫(yī)學科研、預防醫(yī)學科研、社會醫(yī)學科研(包括衛(wèi)生事業(yè)管理學研究和醫(yī)學心理學科)。 一般來說,醫(yī)學科研的分類,常按設計類型的不同,分為以下幾種基本類型。(圖1-1),2 、 醫(yī)學研究設計的4個基本原則,重復、隨機、對照、均衡是實驗設計的4個基本原則,在實驗設計中務必要嚴格遵守。否則,實驗研究結果的可靠性將大受影響。所謂重復,就是實驗因素各水平組合下要有足夠的樣本含量。

49、因為統計學研究的是隨機現象的變化規(guī)律性,重復次數少,內在規(guī)律表現不出來。在統計學上可根據設計類型選用相應的樣本含量估算公式進行計算。所謂隨機,就是每一個實驗單位都有同等的機會被分配到任何一個組中去,分組的結果不受人為因素的干擾和影響。在統計學上有許多實現隨機化的具體方法,應當嚴格實施。千萬不可用“隨便”取代隨機。,所謂對照,就是要設立參照物。因為沒有對比,就無法鑒別優(yōu)劣。例如,要考察一種新的抗癌藥的療效如何,必須設立一個對照組。在對照

50、組里的癌癥患者,可以什么抗癌藥都不用(稱為空白對照,在臨床上應當慎用這種對照),亦可以用現在公認的最好抗癌藥作為對照藥(稱為標準對照)。在研究干預措施的效果時,直接觀察到的往往是多種因素的效應交織在一起的綜合作用,而合理的對照能成功地將措施的真實效應客觀、充分地識別出來,使研究者得以做出正確評價。一般來說,設立對照可以最大可能地避免下列因素或現象對臨床試驗研究結果的影響:①不能預知的結局(unpredictable outcome

51、),由于人類認識的局限性,干預效應受一些目前未被認識的潛在未知因素的影響。②向均數回歸(regression to the mean)在臨床實踐中,有些極端的臨床癥狀或體征有向均數回歸的現象。所謂均衡,就是要設法使各條件(即實驗因素的各水平組合)下的受試對象受到非實驗因素的干擾和影響的機會和數量基本相等。這樣一來,由各組受試對象反映出來的實驗效應才能較為客觀地體現出實驗因素取不同水平時所產生的效果。,三、統計分析的意義:,有些論文

52、中的資料十分豐富,既有多因素又有多指標。遺憾的是有些作者未對資料作統計分析就作出了結論;有些雖然作了統計分析,但一般僅作單因素分析,并且,所選用的分析方法還不完全得當。由于統計軟件日趨普及,人們可以利用科學的統計分析方法,對同一份資料進行更深入的的分析,這有助于更好地發(fā)掘資料中所蘊藏的信息,揭示資料間的相互關系和內在規(guī)律性。對于同一份實際資料,由于研究的目的、觀察的角度不同,所選用的統計處理方法也會不盡相同。用多種統計分析方法對資料進行

53、多層次、多側面的綜合處理,盡量挖掘各方面的信息是十分必要的,也是完全可能的。,對資料作統計分析時,可從以下幾個方面考慮如何合理選擇各種統計分析方法。其一,資料類型與描述統計量的選擇。資料一般可分為定量與定性兩大類,定量資料可細分為計量和計數兩種;定性資料可細分為有序和無序(名義)兩種。描述定量資料常用的統計指標有:平均指標、變異指標、分位數等;描述定性資料常用的統計指標有絕對數和相對數等。,按變量測量的精確程度由低到高,將數據分類為

54、:名義數據(如性別、婚姻狀況)、有序變量(如療效,類別間差別大小難以度量)、區(qū)間變量(如攝氏體溫,類別間差別有實際意義)、比變量(如身高,除具有區(qū)間變量的特征外,還具有真實意義的零點。攝氏溫度的零點為水結冰時溫度,并非絕對意義的零點,所以它不屬于比變量),其二,資料類型與區(qū)間估計的選擇。常用于定量資料的區(qū)間估計方法有個體值的容許區(qū)間(醫(yī)學上亦稱“正常值范圍”)及總體均值(或其他特定參數)的可信區(qū)間;常用于定性資料的區(qū)間估

55、計方法是總體率的可信區(qū)間。其三,資料類型與統計分析方法的選擇。一般來說,當分組變量為定性變量,指標(或結果)變量為定量變量時,常用的統計分析方法有t檢驗、Z檢驗、方差分析(亦稱F檢驗)和秩和檢驗等;當分組變量和指標(或結果)變量均為定性變量(包括由定量變量轉化而產生的)時,常用的統計分析方法有卡方檢驗、秩和檢驗、Ridit分析、線性趨勢檢驗等。其四,處理多因素多元資料的常見統計分析方法有多元回歸分析、多元方差和協方差分析、聚類分析、

56、主成分分析、因子分析、典型相關分析等。,四、資料統計分析中的錯誤:,在對實際資料進行分析時,從統計分析的角度看,常見的錯誤是:對資料未作統計處理就下結論;多元(或多因素)的資料用一元(或單因素)統計分析方法處理,導致資料的利用率低,不能反映資料的整體情況,不能很好地揭示變量之間的交互作用和內在聯系。,當暴露變量為一個分類變量時,為單因素設計,常見的設計類型有單組設計、兩組的成組設計和配對設計及多組的完全隨機設計。若滿足參數檢驗條件,分別

57、選用單樣本t檢驗、成組兩樣本t檢驗、配對t檢驗及單因素多水平方差分析(one-way ANOVA);若不滿足參數檢驗條件,分別選用ilcoxon秩和檢驗(或Mann-Whitney U檢驗)、Wilcoxon符號秩和檢驗或Kruskal-Wallis H檢驗。 常見錯誤在做檢驗前,不對結局變量的分布和方差齊性進行檢驗,在不滿足參數檢驗的前提條件下對定量資料盲目套用參數檢驗方法。 錯誤舉例,某項研究評價治療前后膝關節(jié)功能(表1),

58、從結果來看,部分指標的標準差是均數的2倍,提示呈偏態(tài)分布,而原作者用單因素方差分析檢驗治療前后的功能得分。正確做法是,選用非參數檢驗的辦法,這個研究是自身配對設計,可選用Wilcoxon符號秩和檢驗,或對結局變量進行變換,滿足參數檢驗的要求。,,用Pearson卡方檢驗分析有序結局變量的數據?,某項研究探討原發(fā)性肝癌肝動脈碘油化療栓塞(TACE)和三維適形放療(3DCRT)綜合治療價值(見表5)。原文將不同水平的療效進行了合并,

59、采用Pearson卡方檢驗比較兩組的有效率分別為71%和45%,P值為0.0097,這樣合并沒有充分利用資料的有序信息;而若用2×C表卡方檢驗,P值為0.0827,沒有考慮療效的遞減關系。所以,應選用CMH卡方檢驗行平均得分差的分析結果,P值為0.0160,(或用Ridit檢驗)才能做出正確的評價。,重復測量的數據用單因素分析:,某研究探討重型顱腦創(chuàng)傷患者硫酸鎂治療與患者血清丙二醛(MDA)含量及預后關系。治療組和對照組

60、患者分別在入院時、用藥后24、48和72小時抽取靜脈血,檢測MDA濃度(表3)。原文采用成組t檢驗在不同時間點進行兩組比較,割裂了整體設計,沒有考慮到對于同一觀測對象,不同時間點上的數據是不獨立的。該研究可選用重復測量設計的方差分析。對于較復雜的重復測量設計資料,可選擇混合模型(Mixedmodel)或廣義估計方程(GEE)等方法進行分析。,不能充分利用數據的信息,缺乏深入分析(浙江預防醫(yī)學2012 年第24 卷第4期),男童行

61、為因子均數比較( x ± s ),女童行為因子均數比較( x ± s ),作者分別對男童和女童的每項因子作了t檢驗,沒有很好的利用數據中隱藏的分布信息,另外,多次重復t檢驗會增加I型錯誤的概率。,對于這類數據可以考慮采用輪廓分析(Profile Analysis)方法:1、平行檢驗2、相合檢驗3、水平檢驗,筆誤?統計學知識的缺乏?或雜志社審稿的錯誤?,,,,五、多變量分析與單變量分析 多變量分析是

62、對m個反應變量進行一次假設檢驗(Hotelling T2檢驗或MANOVA),對組間差別作出推斷。在大多數情況下,多變量假設檢驗結論與對m個反應變量進行m次單變量假設檢驗(t檢驗或ANOVA)的結論是一致的,即多變量假設檢驗拒絕H0,m次單變量假設檢驗至少有一次拒絕H0,SPSS、SAS等統計軟件也是先給出多變量假設檢驗結果,再給出單變量假設檢驗結果,作為多變量分析的補充。,例: 某婦幼保健院將孕婦隨機分兩組,一組接受孕期保健教育,另

63、一組作為對照。表14-3是同一日出生的13名順產嬰兒的體重和身長,問孕期保健教育對嬰兒生長發(fā)育有無促進作用? 表中用兩個指標反映嬰兒的生長發(fā)育狀況,通過孕期保健教育組和對照組嬰兒樣本均數比較,推論兩組總體均數μ1和μ2是否相等,進而得出孕期保健教育對嬰兒體格發(fā)育有無影響的結論。,體重:t=2.35,p=0.038 身高:t=1.99,p=0.071,理論上單變量假設檢驗不能代替多變量假設檢驗,主要理由: ①m次單變量

64、假設檢驗增加假陽性錯誤的概率,設每次單變量假設檢驗的檢驗水準定為a,做完m次檢驗I類錯誤的概率增加為am=1-(1-a)m。 ②單變量假設檢驗只說明某一變量在數軸分布上的組間差別,不能反映多個變量在平面或空間上的差別,兩者的意義不同,各自說明各自的問題,不能相互代替。如表14-8的兩組數據,分別對兩組新生兒出生時的體重與身長做單變量t檢驗:體重t=2.35,p=0.038,身長t=1.99,p=0.071,結論不明確。但多變量

65、的Hotelling T2檢驗:T2=9.87,F=4 .58,P=0.03,拒絕H0:μ1= μ2,兩組在平面分布上差別如圖所示。,二組的平面分布,,,二組的空間分布,,,六、充分利用現有的臨床或體檢數據1、描述性研究: 臨床或體檢資料描述性研究包括體檢人群的健康現況分布、疾病的篩檢、生態(tài)學比較等 。2、分析性研究: 分析性研究可利用監(jiān)測或體檢數據所蘊藏的信息再分析研究,以提高研究證據的強度主要包括病例對照研究

66、和隊列研究。病例對照研究資料的特點是回顧性資料、產生偏倚的可能性較大。隊列研究資料屬前瞻性,沒有回憶性偏倚,但存在失訪偏倚,與病例對照研究相比偏倚較少。隊列研究可直接估計危險度指標等 。,圖1 病例對照研究原理示意圖,,調查方向:收集回顧性資料,比較 人數 暴露 疾病,病例,對照,,,,,+,-,+,-,a,c

67、,b,d,OR:(a/c)/(b/d)=ad/bc(反映暴露與疾病關聯大小與方向的指標),脂肪肝,對照組,暴露因素,,ALT 甘油三酯高密度脂蛋白,ALT 甘油三酯高密度脂蛋白,,,,,,,正常,正常,異常,異常,結局,,脂肪肝的病例-對照研究(一果多因),表2 脂肪肝Logistic回歸分析的結果,從表1看出,各參數估計值的Wald χ2檢驗,均有P<0.05,都有統計顯著性。且三者的OR值分別為1.030、1.819和

68、0.246。,,,,,目標人群 未患某研究 疾病,代表性樣本,,,Yes,No,Yes,No,,,,暴露組,非暴露組,,,時間順序,,,,,是否暴露某個危險因子,,結局(疾病),圖2 隊列研究的結構模式圖,,,,,時間順序,過去,現在,將來,,,,,歷史性隊列,雙向性隊列,前瞻性隊列,回顧性收集已有的歷史資料,回顧性收集已有的歷史資料,繼續(xù)前瞻性收集資料,前瞻性收集資料,圖3 隊列研究類型示意圖,Thank you for

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論