

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、數(shù)據(jù)分析中數(shù)理統(tǒng)計方法的正確使用,,重要假定,作者所處理的數(shù)據(jù)屬于隨機變量的特定樣本。作者已經掌握最基本的數(shù)理統(tǒng)計學常識,如概率、假設檢驗、均值、方差、標準差、正態(tài)分布、相關分析、回歸分析、方差分析……。,數(shù)理統(tǒng)計問題的重要性,在科學研究中,經常會涉及到對隨機變量大小、離散及分布特征的描述以及對2個或多個隨機變量之間的關系描述問題。地學、環(huán)境科學研究也不例外。對隨機變量及隨機變量之間的關系進行定量描述的數(shù)學工具就是數(shù)理統(tǒng)計學。在科
2、學研究中,能否正確使用各種數(shù)理統(tǒng)計方法關系到所得出結論的客觀性和可信性。所以,來稿中使用的數(shù)理統(tǒng)計方法是否正確應是學術期刊編輯和作者極為重視的問題。目前,國內科技期刊對稿件中數(shù)理統(tǒng)計方法問題的重視程度存在差異。,1 統(tǒng)計軟件的選擇,統(tǒng)計分析通常涉及大量的數(shù)據(jù),需要較大的計算工作量。在進行統(tǒng)計分析時,盡管作者可以自行編寫計算程序,但在統(tǒng)計軟件很普及的今天,這樣做是毫無必要的。出于對工作效率以及對算法的通用性、可比性的考慮,一些學術
3、期刊要求作者采用專門的數(shù)理統(tǒng)計軟件進行統(tǒng)計分析。,1 統(tǒng)計軟件的選擇,問題:作者未使用專門的數(shù)理統(tǒng)計軟件,而采用Excel這樣的電子表格軟件進行數(shù)據(jù)統(tǒng)計分析。由于電子表格軟件提供的統(tǒng)計分析功能十分有限,只能借助它進行較為簡單的統(tǒng)計分析,故我們不主張作者采用這樣的軟件進行統(tǒng)計分析。,1 統(tǒng)計軟件的選擇,目前,國際上已開發(fā)出的專門用于統(tǒng)計分析的商業(yè)軟件很多,比較著名有SPSS(Statistical Package for Socia
4、l Sciences)和SAS(Statistical Analysis System)。此外,還有BMDP和STATISTICA等……。SPSS是專門為社會科學領域的研究者設計的,但此軟件在自然科學領域也得到廣泛應用。BMDP是專門為生物學和醫(yī)學領域研究者編制的統(tǒng)計軟件。,1 統(tǒng)計軟件的選擇,目前,國際學術界有一條不成文的約定:凡是用SPSS和SAS軟件進行統(tǒng)計分析所獲得的結果,在國際學術交流中不必說明具體算法。由此可見,SPS
5、S和SAS軟件已被各領域研究者普遍認可。我們建議作者們在進行統(tǒng)計分析時盡量使用這2個專門的統(tǒng)計軟件。目前,有關這2個軟件的使用教程在書店中可很容易地買到。,2.1 均值的計算 :理論問題,1)均值(準確的稱呼應為“樣本均值”)的統(tǒng)計學意義:反映隨機變量樣本的大小特征。2)均值對應于隨機變量總體的數(shù)學期望—總體的數(shù)學期望客觀上決定著樣本的均值,反過來,通過計算樣本的均值可以描述總體的數(shù)學期望。,2.1 均值計算:理論問題(續(xù)),3
6、)在處理實驗數(shù)據(jù)或采樣數(shù)據(jù)時,經常會遇到對相同采樣或相同實驗條件下同一隨機變量的多個不同取值進行統(tǒng)計處理的問題。4)為找到代表這些觀測值總體大小特征的代表值(統(tǒng)計量,該統(tǒng)計量根據(jù)樣本數(shù)據(jù)算出),多數(shù)作者會不假思索地直接給出算術平均值和標準差。顯然,這種做法是不嚴謹?shù)摹灰欢偸钦_的,2.2 均值計算:技術問題,在數(shù)理統(tǒng)計學中,作為描述隨機變量樣本的總體大小特征的統(tǒng)計量有算術平均值、幾何平均值和中位數(shù)等多個。何時用算術平均值?何
7、時用幾何平均值?以及何時用中位數(shù)?這不能由研究者根據(jù)主觀意愿隨意確定,而要根據(jù)隨機變量的分布特征確定。,2.2 均值計算:技術問題(續(xù)),反映隨機變量總體大小特征的統(tǒng)計量是數(shù)學期望,而在隨機變量的分布服從正態(tài)分布時,其數(shù)學期望就可以用樣本的算術平均值描述。此時,可用樣本的算術平均值描述隨機變量的大小特征。如果所研究的隨機變量不服從正態(tài)分布,則算術平均值不能準確反映該變量的大小特征。在這種情況下,可通過假設檢驗來判斷隨機變量是否服從對數(shù)
8、正態(tài)分布。如果服從對數(shù)正態(tài)分布,則幾何平均值就是數(shù)學期望的值。此時,就可以計算變量的幾何平均值。如果隨機變量既不服從正態(tài)分布也不服從對數(shù)正態(tài)分布,則按現(xiàn)有的數(shù)理統(tǒng)計學知識,尚無合適的統(tǒng)計量描述該變量的大小特征。此時,可用中位數(shù)來描述變量的大小特征。,3 相關分析:相關系數(shù)的選擇,在相關分析中,作者們常犯的錯誤是:簡單地計算Pearson 積矩相關系數(shù),而且既不給出正態(tài)分布檢驗結果,也往往不明確指出所計算的相關系數(shù)就是Pearson
9、積矩相關系數(shù)。在數(shù)理統(tǒng)計學中,除有針對數(shù)值變量設計的Pearson 積矩相關系數(shù)(對應于 “參數(shù)方法”)外,還有針對順序變量(即“秩變量”)設計的Spearman秩相關系數(shù)和Kendall秩相關系數(shù)(對應于 “非參數(shù)方法”)等。Pearson 積矩相關系數(shù)可用于描述2個隨機變量的線性相關程度,Spearman或Kendall秩相關系數(shù)用來判斷兩個隨機變量在二維和多維空間中是否具有某種共變趨勢。,3 相關分析:相關系數(shù)的選擇,在相關
10、分析中,計算各種相關系數(shù)是有前提條件的。在相關分析中,對于秩變量,一般別無選擇,只能計算Spearman或Kendall秩相關系數(shù)。對于數(shù)值變量,只要條件許可,應盡量使用檢驗功效最高的參數(shù)方法,即計算用Pearson 積矩相關系數(shù)。只有計算Pearson 積矩相關系數(shù)的前提不存在時,才考慮退而求其次,計算專門為秩變量設計的Spearman或Kendall秩相關系數(shù)(盡管這樣做會導致檢驗功效的降低)。,3 相關分析:相關系數(shù)的選擇,
11、對于數(shù)值變量,相關系數(shù)選擇的依據(jù)是變量是否服從正態(tài)分布,或變換后的數(shù)據(jù)是否服從正態(tài)分布。對于二元相關分析,如果2個隨機變量服從二元正態(tài)分布假設,則應該用Pearson 積矩相關系數(shù)描述這2個隨機變量間的相關關系。如果樣本數(shù)據(jù)不服從二元正態(tài)分布,則可嘗試進行數(shù)據(jù)變換,看變換后的數(shù)據(jù)是否符合正態(tài)分布?如果是,則可以針對變換后的數(shù)據(jù)計算Pearson 積矩相關系數(shù);否則,就不能計算Pearson 積矩相關系數(shù),而應改用檢驗功效較低的Spe
12、arman或Kendall秩相關系數(shù)(此時,如果強行計算Pearson 積矩相關系數(shù)有可能會得出完全錯誤的結論)。,4 相關分析與回歸分析的區(qū)別,相關分析和回歸分析是極為常用的2種數(shù)理統(tǒng)計方法,在環(huán)境科學及其它科學研究領域有著廣泛的用途。然而,由于這2種數(shù)理統(tǒng)計方法在計算方面存在很多相似之處,且在一些數(shù)理統(tǒng)計教科書中沒有系統(tǒng)闡明這2種數(shù)理統(tǒng)計方法的內在差別,從而使一些研究者不能嚴格區(qū)分相關分析與回歸分析 。,4 相關分析與回歸分析的區(qū)別
13、,1)最常見的錯誤是:用回歸分析的結果解釋相關性問題。例如,作者將“回歸直線(曲線)圖”稱為“相關性圖”或“相關關系圖”;將回歸直線的R2(擬合度,或稱“可決系數(shù)”)錯誤地稱為“相關系數(shù)”或“相關系數(shù)的平方”;根據(jù)回歸分析的結果宣稱2個變量之間存在正的或負的相關關系。,4 相關分析與回歸分析的區(qū)別,2)相關分析與回歸分析均為研究2個或多個變量間關聯(lián)性的方法,但2種數(shù)理統(tǒng)計方法存在本質的差別,即它們用于不同的研究目的。3)相關分析的目的
14、在于檢驗兩個隨機變量的共變趨勢(即共同變化的程度),回歸分析的目的則在于試圖用自變量來預測因變量的值。,4 相關分析與回歸分析的區(qū)別,4)在相關分析中,兩個變量必須同時都是隨機變量,如果其中的一個變量不是隨機變量,就不能進行相關分析。這是相關分析方法本身所決定的。,4 相關分析與回歸分析的區(qū)別,5)對于回歸分析,其中的因變量肯定為隨機變量(這是回歸分析方法本身所決定的),而自變量則可以是普通變量(有確定的取值)也可以是隨機變量。,4 相
15、關分析與回歸分析的區(qū)別,6)如果自變量是普通變量,即模型Ⅰ回歸分析,采用的回歸方法就是最為常用的最小二乘法。7)如果自變量是隨機變量,即模型Ⅱ回歸分析,所采用的回歸方法與計算者的目的有關。在以預測為目的的情況下,仍采用“最小二乘法”(但精度下降—最小二乘法是專為模型Ⅰ 設計的,未考慮自變量的隨機誤差);在以估值為目的(如計算可決系數(shù)、回歸系數(shù)等)的情況下,應使用相對嚴謹?shù)姆椒ǎㄈ纭爸鬏S法”、“約化主軸法”或“Bartlett法”
16、)。,4 相關分析與回歸分析的區(qū)別,8)顯然,對于回歸分析,如果是模型Ⅱ回歸分析,鑒于兩個隨機變量客觀上存在“相關性”問題,只是由于回歸分析方法本身不能提供針對自變量和因變量之間相關關系的準確的檢驗手段,因此,若以預測為目的,最好不提“相關性”問題;若以探索兩者的“共變趨勢”為目的,應該改用相關分析。9)如果是模型Ⅰ回歸分析,就根本不可能回答變量的“相關性”問題,因為普通變量與隨機變量之間不存在“相關性”這一概念(問題在于,大多數(shù)的回
17、歸分析都是模型Ⅰ回歸分析!)。此時,即使作者想描述2個變量間的“共變趨勢”而改用相關分析,也會因相關分析的前提不存在而使分析結果毫無意義。,4 相關分析與回歸分析的區(qū)別,10)需要特別指出的是,回歸分析中的R2在數(shù)學上恰好是Pearson積矩相關系數(shù)r的平方。因此,這極易使作者們錯誤地理解R2的含義,認為R2就是 “相關系數(shù)”或“相關系數(shù)的平方”。問題在于,對于自變量是普通變量(即其取值有確定性的變量)、因變量為隨機變量的模型Ⅰ回歸分析
18、,2個變量之間的“相關性”概念根本不存在,又何談“相關系數(shù)”呢?11)更值得注意的是,一些早期的教科書作者不是用R2來描述回歸效果(擬合程度,擬合度)的,而是用Pearson積矩相關系數(shù)來描述。這就更容易誤導讀者。,5 重要的數(shù)理統(tǒng)計學常識,5.1 假設檢驗基本思想統(tǒng)計推斷:是根據(jù)樣本數(shù)據(jù)推斷總體特征的一種方法。假設檢驗:是進行統(tǒng)計推斷的途徑之一(另一種途徑是參數(shù)估計,如點估計和區(qū)間估計)。假設檢驗中的關鍵問題:1)在原假設
19、成立的情況下,如何計算樣本值或某一極端值發(fā)生的概率?2)如何界定小概率事件?,5.1 假設檢驗,基本思路首先,對總體參數(shù)值提出假設(原假設);然后,利用樣本數(shù)據(jù)提供的信息來驗證所提出的假設是否成立(統(tǒng)計推斷)——如果樣本數(shù)據(jù)提供的信息不能證明上述假設成立,則應拒絕該假設;如果樣本數(shù)據(jù)提供的信息不能證明上述假設不成立,則不應拒絕該假設。接受或拒絕原假設的依據(jù) 小概率事件不可能發(fā)生。顯然,這樣做是有風險的(小概率事件真的發(fā)生了)。
20、,5.1 假設檢驗,基本步驟1)提出原假設(或稱“零假設”,H0);2)選擇檢驗統(tǒng)計量;3)根據(jù)樣本數(shù)據(jù)計算檢驗統(tǒng)計量觀測值的發(fā)生概率(相伴概率,p);4)根據(jù)給定的小概率事件界定標準(顯著性水平,如0.05,0.01)做出統(tǒng)計推斷。,5.1 假設檢驗,基本步驟:為什么要設計并計算檢驗統(tǒng)計量?在假設檢驗中,樣本值(或更極端的取值)發(fā)生的概率不能直接通過樣本數(shù)據(jù)計算,而是通過計算檢驗統(tǒng)計量觀測值的發(fā)生概率而間接得到的。所設計的
21、檢驗統(tǒng)計量一般服從或近似服從某種已知的理論分布(如t-分布、F-分布、卡方分布),易于估算其取值概率。對于不同的假設檢驗和不同的總體,會有不同的選擇檢驗統(tǒng)計量的理論和方法。,5.1 假設檢驗,基本步驟:計算檢驗統(tǒng)計量觀測值的發(fā)生概率 在假定原假設成立的前提下,利用樣本數(shù)據(jù)計算檢驗統(tǒng)計量觀測值發(fā)生的概率(即p值,又稱“相伴概率”—指該檢驗統(tǒng)計量在某個特定的極端區(qū)域在原假設成立時的概率)。該概率值間接地給出了在原假設成立的條件下樣本值
22、(或更極端值)發(fā)生的概率。,5.1 假設檢驗,進行統(tǒng)計推斷依據(jù)預先確定的 “顯著性水平” (即α值),如0.01或0.05,決定是否拒絕原假設。如果p值小于α值,即認為原假設成立時檢驗統(tǒng)計量觀測值的發(fā)生是小概率事件,則拒絕原假設。否則,就接受原假設。,5.2 顯著性水平:概念與意義,在假設檢驗中,顯著性水平(Significant level,用α表示)的確定是假設檢驗中至關重要的問題。顯著性水平是在原假設成立時檢驗統(tǒng)計量的制落在
23、某個極端區(qū)域的概率值。因此,如果取α= 0.05,如果計算出的p值小于α ,則可認為原假設是一個不可能發(fā)生的小概率事件。當然,如果真的發(fā)生了,則犯錯誤的可能性為5%。顯然,顯著性水平反映了拒絕某一原假設時所犯錯誤的可能性,或者說, α是指拒絕了事實上正確的原假設的概率。,5.2 顯著性水平:通常的取值,α值一般在進行假設檢驗前由研究者根據(jù)實際的需要確定。常用的取值是0.05或0.01。對于前者,相當于在原假設事實上正確的情況下,研究者
24、接受這一假設的可能性為95%;對于后者,則研究者接受事實上正確的原假設的可能性為99%。顯然,降低α值可以減少拒絕原假設的可能性。因此,在報告統(tǒng)計分析結果時,必須給出α值。,5.2 顯著性水平:進行統(tǒng)計推斷,在進行假設檢驗時,各種統(tǒng)計軟件均會給出檢驗統(tǒng)計量觀測值以及原假設成立時該檢驗統(tǒng)計量取值的相伴概率(即檢驗統(tǒng)計量某特定取值及更極端可能值出現(xiàn)的概率,用p表示)。p值是否小于事先確定的α值,是接受或拒絕原假設的依據(jù)。如果p值小于事
25、先已確定的α值,就意味著檢驗統(tǒng)計量取值的可能性很小,進而可推斷原假設成立的可能性很小,因而可以拒絕原假設。相反,如果p值大于事先已確定的α值,就不能拒絕原假設。,5.3 統(tǒng)計推斷:過去的回憶,1)在計算機技術十分發(fā)達,以及專業(yè)統(tǒng)計軟件功能十分強大的今天,計算檢驗統(tǒng)計量及其相伴概率是一件十分容易的事情。2)然而,在20世紀90年代以前,只有服從標準正態(tài)分布的檢驗統(tǒng)計量,人們可以直接查閱事先準備好的標準正態(tài)分布函數(shù)表,從中獲得特定計算結果
26、的相伴概率。而對于的服從t-分布、F-分布、卡方分布或其它特殊的理論分布的檢驗統(tǒng)計量(大多數(shù)的假設檢驗是這樣),人們無法直接計算相伴概率。人們通常查閱各類假設檢驗的臨界值表進行統(tǒng)計推斷。這些表格以自由度和很少的幾個相伴概率(通常為0.1、0.05和0.01)為自變量,以檢驗統(tǒng)計量的臨界值為函數(shù)排列。,5.3 統(tǒng)計推斷:過去的回憶,3)在進行統(tǒng)計推斷時,人們使用上述臨界值表根據(jù)事先確定的顯著性水平,查閱對應于某一自由度和特定相伴概率的檢驗
27、統(tǒng)計量的臨界值,然后將所計算出的檢驗統(tǒng)計量與該臨界值相比較。如果檢驗統(tǒng)計量的計算值大于臨界值,即實際的相伴概率小于事先規(guī)定的顯著性水平,便可拒絕原假設。否則,可接受原假設。,5.4 顯著性水平:舉例,在根據(jù)顯著性水平進行統(tǒng)計推斷時,應注意原假設的性質。以二元相關分析為例,相關分析中的原假設是“相關系數(shù)為零”(即2個隨機變量間不存在顯著的相關關系)。如果計算出的檢驗統(tǒng)計量的相伴概率(p值)低于事先給定α值(如0.05),就可以認為“相關
28、系數(shù)為零”的可能性很低, 既2個隨機變量之間存在顯著的相關關系。在正態(tài)分布檢驗時,原假設是“樣本數(shù)據(jù)來自服從正態(tài)分布的總體”。此時,如果計算出的檢驗統(tǒng)計量的相伴概率(p值)低于事先給定α值(如0.05),則表明數(shù)據(jù)不服從正態(tài)分布。只有p值高于α值時,數(shù)據(jù)才服從正態(tài)分布。這與相關分析的假設檢驗不同。,5.4 顯著性水平:舉例,作者在描述相關分析結果時常有的失誤是:僅給出相關系數(shù)的值,而不給出顯著性水平。這就無法判斷2個隨機變量間的相關性
29、是否顯著。有時作者不是根據(jù)顯著性水平判斷相關關系是否顯著,而是根據(jù)相關系數(shù)的大小來推斷(相關系數(shù)越近1,則相關關系越顯著)。問題是,相關系數(shù)本身是一個基于樣本數(shù)據(jù)計算出的觀測值,其本身的可靠性尚需檢驗。此外,作者在論文中常常用“顯著相關”和“極顯著相關”來描述相關分析結果,即認為p值小于0.05就是顯著相關關系(或顯著相關),小于0.01就是極顯著相關關系(或極顯著相關)。,5.5 統(tǒng)計推斷的注意事項,在假設檢驗中,只有 “顯著”和
30、 “不顯著”,沒有“極顯著”這樣的斷語。只要計算出的檢驗統(tǒng)計量的相伴概率(p值)低于事先確定的α值,就可以認為檢驗結果“顯著”(相關分析的原假設是“相關系數(shù)為零”,故此處的“顯著”實際意味著“相關系數(shù)不為零”,或說“2個隨機變量間有顯著的相關關系”);同樣,只要計算出的檢驗統(tǒng)計量的相伴概率(p值)高于事先確定的α值,就可以認為檢驗結果“不顯著”。,5.5 統(tǒng)計推斷的注意事項,在進行相關分析時,不能同時使用0.05和0.01這2個顯著性水
31、平來決定是否拒絕原假設,只能使用其中的1個。,有關相關分析的斷語,1)顯著和不顯著:描述相關關系是否存在。2)相關性強或不強:在存在相關關系的前提下,這種相關關系的強或弱??梢哉J為,相關系數(shù)越接近1,則相關性越強。聲明:第1)條是公認的數(shù)理統(tǒng)計常識,但第2)條是個人理解,僅供參考。本文不對第2)條承擔責任。,6重要的數(shù)理統(tǒng)計學常識,1)假設檢驗統(tǒng)計推斷:單側檢驗與雙側檢驗對于假設檢驗,其檢驗統(tǒng)計量的異常取值有2個方向,即概率分布
32、曲線的左側(對應于過小的值)和右側(對應于過大的值)。,檢驗統(tǒng)計量的極端取值,檢驗統(tǒng)計量在左側和右側均有可能取值,單側檢驗與雙側檢驗,一般情況下,概率分布函數(shù)曲線兩側尾端的小概率事件都要考慮(即雙側檢驗)。如果事先有把握確定其中的一側不可能取值,則僅需對另一側的小概率事件進行檢驗即可(單側檢驗)。在用 “查表法”進行統(tǒng)計推斷時,基于單側小概率事件檢驗的臨界值表稱“單尾表”,基于雙側小概率事件檢驗的臨界值表稱“雙尾表”。除t-分布臨界值
33、表是雙尾表外,大多數(shù)的檢驗臨界值表均為單尾表。,單側檢驗與雙測檢驗,在顯著性水平一定的情況下(例如α =0.05),對于單尾表,單側檢驗時仍使用α進行統(tǒng)計推斷,雙側檢驗則用α /2進行統(tǒng)計推斷;對于雙尾表,單側檢驗時改用2α進行統(tǒng)計推斷,雙側檢驗則用α 進行統(tǒng)計推斷。在統(tǒng)計軟件(如SPSS或SAS統(tǒng)計軟件)給出的計算結果中,已標注出所計算的相伴概率是單側還是雙側,對應于上述的單尾表和雙尾表。,單側檢驗與雙側檢驗,以下是SPSS 中的單
34、樣本t檢驗輸出結果:One-Sample Test(原假設:儲戶1次平均存取的現(xiàn)金與2000元無顯著差異)Test Value=2000(均值比較的參比值)t=1.240(檢驗統(tǒng)計量的觀測值)df=312(自由度,樣本量N=313)Sig.(2-tailed)=0.216(雙側相伴概率p )Mean Difference=473.78(均值的標準誤差)95% Confidence Interval of the Diffe
35、rence(總體均值與原假設值之差的95%的置信區(qū)間):-278.13~1225.69(有95%的把握可認為:儲戶1次平均存取的金額為1721.87~3225.69元),單側檢驗與雙側檢驗,上述檢驗屬 “均值比較”,是雙側檢驗(大于或小于2000元都算拒絕原假設),計算的相伴概率也是雙側的。因此,可直接用p與α比較。取α=0.05,則因p大于α,故不能拒絕原假設(不是小概率事件)。統(tǒng)計推斷結果:根據(jù)313個儲戶調查數(shù)據(jù),每個儲戶一次平均
36、存取金額大體為2000元。,單側檢驗與雙側檢驗,在統(tǒng)計軟件中,可通過選擇Test of Significance選項來控制所輸出的相伴概率是單尾(1 tailed)概率還是雙尾(2 tailed )概率。,6重要的數(shù)理統(tǒng)計學常識,2)正態(tài)分布檢驗目的:檢驗樣本是否來自正態(tài)分布的總體原假設:樣本來自正態(tài)分布的總體分布檢驗只能使用非參數(shù)方法(只有分布形式已知時才能使用參數(shù)方法)。不同的統(tǒng)計軟件給出了不同的檢驗方法。,正態(tài)分布檢驗,在
37、SAS中,提供了Shapiro-Wilk(適用于樣本量小于50的情形)檢驗法。此檢驗無單尾、雙尾之分。在SPSS中提供了卡方檢驗(Chi-Square Test)和單樣本的 Kolmogorov-Smirnov(柯爾莫哥洛夫-斯米爾諾夫,簡稱K-S)檢驗。后者比前者精確一些,建議采用。,正態(tài)分布檢驗,單樣本的 Kolmogorov-Smirnov(柯爾莫哥洛夫-斯米爾諾夫,簡稱K-S)檢驗屬于雙側檢驗,計算檢驗統(tǒng)計量(Z)的雙尾概率。
38、,6 重要的數(shù)理統(tǒng)計學常識,3) 均值比較a)將樣本均值與某一特定值相比:t-檢驗(參數(shù)檢驗)原假設:總體均值與特定值無顯著差異前提:樣本來自正態(tài)分布的總體雙側檢驗:是否等于。單側檢驗:已知不可能大于(或不可能小于),檢驗是否等于。b)比較2個獨立樣本均值: t-檢驗(參數(shù)檢驗)原假設:2個樣本所代表的2個總體的均值無顯著差異用于對2個來自正態(tài)分布總體的樣本的大小進行比較,且2個樣本相互獨立(無相關關系)。改檢驗有單側
39、和雙側之分。,5 重要的數(shù)理統(tǒng)計學常識,3)均值比較c) 比較2個獨立總體大小的非參數(shù)檢驗適用于對2個順序變量的大小進行比較或對2個不服從正態(tài)分布的數(shù)值變量的大小進行比較“Mann-Whitney U” 檢驗:適合樣本量較大的樣本。 “Wilcoxon秩和”檢驗:與“Mann-Whitney U” 檢驗在本質上完全等價。Kolmogorov單側檢驗:適用于樣本量較小的樣本。,5 重要的數(shù)理統(tǒng)計學常識,3)均值比較d)比較多個
40、來自正態(tài)分布總體的樣本均值的檢驗方法:單因子方差分析(single-factor anova)。對于將因子作為固定處理(而不是隨機變量)的情形,即模型1單因子方差分析,實際上可以看作比較2個總體均值的t-檢驗的直接推廣。該方法屬于參數(shù)檢驗。有關假定:多個樣本相互獨立、樣本均服從正態(tài)分布、方差同質性(各個樣本的方差大小沒有顯著差異)等。原假設:各樣本的均值間無顯著差異,即某影響因子的不同取值(等級)對各樣本的大小沒有影響。,5 重要
41、的數(shù)理統(tǒng)計學常識,3)均值比較d)比較多個來自非正態(tài)分布總體的樣本均值的檢驗方法:Kruskal-Wallis檢驗:該方法基于順序變量設計,用于檢驗3個以上獨立樣本是否來自大小相同的總體,是應用最廣泛的非參數(shù)檢驗方法。推廣的中位數(shù)檢驗:用于檢驗3個以上的獨立樣本是否來自中位數(shù)無顯著差異的樣本。該方法檢驗功效低,不推薦采用。原假設:各獨立樣本所代表的總體的中位數(shù)無顯著差異。Friedman秩方差分析:用于檢驗3個以上相關樣本是否來
42、自大小相同的總體。,案例1,2.4 Cd、Pb之間的交互作用如表4所示,三種花卉植物各部位對重金屬Cd、Pb的積累量與培養(yǎng)溶液中所投加的Cd、Pb量之間,可以很恰當?shù)乇桓鞫嘣貧w方程表示出來,它們之間呈極顯著相關關系(P<0.01),并且各部位的Cd、Pb積累量與溶液中所投加的該種重金屬濃度之間也呈極顯著相關關系,各對應偏相關系數(shù)的差異性顯著標準值P都小于0.01。對于鳳仙花,其地上部積累Cd量與所投加的Pb量呈顯著正相關,而
43、根部卻與所投加的Pb量呈負相關,但這種作用是不顯著的,因此可認為根部積累Cd量與所投加的Pb量無關,地上部和根部積累的Pb量與所投加的Cd量都呈負相關,只不過對于前者是極顯著的,對于后者不顯著,因此可認為,Pb對鳳仙花地上部積累Cd有顯著的促進作用,而Cd對鳳仙花地上部積累Pb有極顯著的抑制作用,兩種情況下對于根部卻都沒有明顯影響。對于金盞菊,其地上部和根部積累Cd量與所投加的Pb量呈負相關,但只對根部是顯著的,而對于地上部Pb積累量
44、與所投加的Cd量之間呈顯著負相關,對于根部Pb積累量反而成顯著正相關。總之,Pb對金盞菊根部積累Cd有抑制作用,而Cd對金盞菊地上部吸收Pb有抑制作用,對根部積累Pb有促進作用。,案例1中隱含的相關性的判定標準,有相關性,但不顯著(p>0.05);有相關性,顯著(0.05>p>0.01);有相關性,極顯著(p<0.01).,案例2,3.3 BDE209與ΣPBDEs的相關分析運用統(tǒng)計軟件SPSS對各研究區(qū)域
45、中BDE209與ΣPBDEs進行相關分析.用K-S檢驗對變量(BDE209和ΣPBDEs)進行正態(tài)分布檢驗發(fā)現(xiàn),珠江(p>0.200)、珠江口(p>0.091)和澳門水域(p>0.110)呈正態(tài)分布(α=0.05).因此對珠江、珠江口和澳門水域進行Pearson相關分析,對東江、西江和南海北部海域進行Kendall相關分析.從表2可以看出,除澳門水域外其它研究區(qū)域,BDE209與ΣPBDEs相關性不顯著(r0.047)
46、,這是由于BDE209與其它PBDEs同系物分別來自不同的溴代阻燃劑;但澳門水域沉積物中的BDE209與ΣPBDEs相關性顯著(r=0.955,p=0)(圖5),表明澳門水域BDE209和其它其它PBDEs同系物具有相同的輸入途徑,正如上述,它們主要都是通過水體中顆粒物輸入的,它們之間較高的相關性是PBDEs在水體顆粒物中再分配的結果,這也證實了澳門水域是珠三角水體環(huán)境中PBDEs的“匯”.,案例3,圖2b表明,1/qN對1/D有很好的
47、線性關系,相關系數(shù)R=0.9922(R2=0.9845)。,案例4,HA對有機農藥甲基對硫磷、西維因、克百威的吸附等溫線見圖3,用線性吸附方程擬合甲基對硫磷、西維因和克百威的吸附等溫線,擬合結果見表3。線性吸附方程為: Q = KdCe + A (1)式中Q為吸附量(mg/kg);Ce為平衡濃度(mg/l);Kd為線性吸附平衡常數(shù),A為線性方程待定常
48、數(shù)。用HA總有機碳標化有機農藥的吸附系數(shù)Kd得有機碳標化吸附系數(shù)Koc,有機農藥在HA上的Koc值見表3。由圖3、表3可知,甲基對硫磷、西維因和克百威在HA上的吸附等溫線較好的符合線性吸附方程,相關系數(shù)在0.8748~0.9940之間,但是克百威的相關系數(shù)要小于甲基對硫磷和西維因;從整體上看有機農藥在HA上的Kd大小順序為:水解處理HA>原始HA>肟化處理HA>氧化處理HA。,案例6,在下表中,作者將回歸方程的可決系數(shù)誤稱為“相關系數(shù)”
49、。,案例7,早期的研究表明有機污染物通過分配作用吸附到土壤/沉積物有機質上,其吸附量與有機碳含量和有機污染物的辛醇-水分配系數(shù)成正比[3]。從甲基對硫磷、西維因和克百威分配系數(shù)Kd與改性HA有機碳含量的關系可知(見圖4), Kd與HA的有機碳含量成正比,但相關性不高分別為:0.7429、0.8870和0.6900,這表明有機農藥在HA上的吸附行為不是由HA的有機碳含量唯一確定,還受到其他因素的影響。圖5為有機農藥在處理前后HA上的有機碳
50、標化吸附系數(shù)Koc對數(shù)(lgKoc)與三種有機農藥辛醇-水分配系數(shù)Kow對數(shù)(lgKow)之間的關系曲線,lgKoc與lgKow呈現(xiàn)較好的線性關系,相關系數(shù)分別為:0.8573、0.8367、0.8420和0.9408,可見用辛醇-水分配系數(shù)來預測有機污染物在土壤/沉積物上的吸附具有一定的合理性[3]。,案例8,,圖6 Kd與腐殖酸O元素含量和H/C比的相關性Fig 6 Correlation of Kd and O conten
51、t and H/C rate of the humic acids,案例9,,,圖4為取每天19:00的DO值與葉綠素值做的趨勢圖,通過分析它們數(shù)據(jù)得出它們的相關性為0.8899,在一定程度上能反映藻類的變化趨勢??梢宰鳛樵孱愒鲩L趨勢的預報指標。,案例10,作圖得到一條直線見圖6,二級動力學速率方程可很好的描述Cu2+、Cd2+在生物膜上的吸附(RCu=0.9989,RCd=0.9978)。,,案例11,案例11(續(xù)),由表1可知,0~
52、5cm土壤層中,活動區(qū)土壤微生物生物量碳和緩沖區(qū)土壤微生物生物量碳分別比背景區(qū)土壤微生物生物量碳降低了65.96%和20.05%,而活動區(qū)土壤微生物生物量碳比緩沖區(qū)土壤微生物生物量碳降低了57.42%,并且3個試驗區(qū)的差異均達到顯著水平(P<0.05). 5~15cm土壤層中,活動區(qū)土壤微生物生物量碳比緩沖區(qū)土壤微生物生物量碳降低了43.14%,而緩沖區(qū)土壤微生物生物量碳比背景區(qū)土壤微生物生物量碳降低了13.85%,3個試驗區(qū)的差
53、異也均達到顯著水平(P<0.05). 15~25cm土壤層中,活動區(qū)土壤微生物生物量碳比緩沖區(qū)土壤微生物生物量碳降低了18.58%,而緩沖區(qū)土壤微生物生物量碳只比背景區(qū)土壤微生物生物量碳降低了11.06%,但3個試驗區(qū)的差異均達到顯著水平(P<0.05).,案例11(續(xù)),由表2可知,在0~5cm土壤層和5~15cm土壤層,旅游踩踏對土壤微生物生物量氮的影響與對土壤微生物生物量碳的影響是相似的.但在15~25cm土壤層,活動
54、區(qū)土壤微生物生物量氮比背景區(qū)土壤微生物生物量氮低,并且達到顯著水平(P0.05) .,案例12,2.10 相關性分析所有相關數(shù)據(jù)分析,通過SPSS10.0軟件分析完成,采用t測驗法檢驗相關系數(shù)的顯著性。,案例12(續(xù)),表2:噴灑菌株與TSNA與硝酸鹽、亞硝酸鹽的相關性及顯著性分析Table2: The correlation and significant analysis of spraying WB5 with nitrate
55、, nitrite,注:**極顯著 *顯著,案例12(續(xù)),從表2可知,晾制期間煙葉中WB5的菌量與硝酸鹽含量幾乎沒有相關性,而與亞硝酸鹽、NNN和總TSNA都存在著顯著的負相關性,與NAT+NAB存在極顯著的負相關性,而與NNK的負相關性則不顯著。結果表明,噴灑WB5菌株可以明顯降低煙葉中的TSNA含量,對煙草的安全性來說,最主要是降低用于卷煙煙葉中的有害物質,因此,該菌株對提高煙草安全性有積極的意義。,案例12(續(xù)),從表3可知,
56、亞硝酸鹽與硝酸鹽存在一定的相關性,相關系數(shù)為0.4875,但不顯著。而各種TSNA及其總量與亞硝酸鹽都存在著顯著的相關性,尤其是與NNN、NAT+NAB和TSNA之間有極顯著的相關性。TSNA總量與NNN、NAT+NAB和NNK都具有極顯著相關性,但與NNK的相關性稍低。而NNK與NNN、NAT+NAB也存在著顯著的相關性,NNN與NAT+NAB之間的相關性極為顯著。,案例13,案例14,案例15,案例16,案例17(初稿),2.1 苦
57、草現(xiàn)存量增加百分比的變化由圖1可知,在Hg2+、Cd2+和Hg2++Cd2+三種脅迫下,苦草的現(xiàn)存量增加百分比均隨著金屬離子濃度的增加而下降,其中在Hg2+或Hg2++Cd2+ >5 µ mol/L時急劇下降,即快速致死,而在Cd2+ 脅迫下,現(xiàn)存量增加百分比隨脅迫程度的增加呈逐步下降趨勢,說明Hg2+和Hg2++Cd2+復合對苦草的毒性遠大于Cd2+。經相關分析,苦草現(xiàn)存量增加百分比與金屬離子濃度間顯著負相關,其決定
58、系數(shù)R2分別為0.893,0.87,0.886,P<0.05。,案例17(初稿:續(xù)1),2.2 對苦草光合與呼吸作用的影響苦草的Pg、Pn、R是隨著金屬離子濃度的增加而下降(圖2)。Pg、Pn與金屬離子濃度間在Cd2+、以及Hg2++Cd2+復合脅迫時呈明顯負相關,其決定系數(shù)R2的范圍是0.744~0.876(P<0.05)。R與金屬離子濃度間只有復合脅迫時明顯負相關,其決定系數(shù)R2=0.726(P<0.05)。,案
59、例17(初稿:續(xù)2),2.3 對苦草葉綠素含量的影響3種處理均導致葉綠素含量隨著時間的延長和金屬離子濃度的增加而降低,但略有波動(圖3)。在低濃度脅迫時(≤2.5 µ mol/L,下同)葉綠素含量升高(Hg2+處理72h時降低),之后較明顯地降低;葉綠素含量與金屬離子的濃度除Hg2+、Cd2+單一脅迫6h時外,其他明顯負相關;其決定系數(shù)R2的范圍是0.669~0.850(P<0.05)。,案例17(初稿:續(xù)3),2.4
60、對苦草可溶性蛋白濃度的影響總體上看,3種處理均導致苦草可溶性蛋白含量隨著時間的延長和金屬離子濃度的增加而明顯降低,但略有波動(圖4)。在單一Hg2+和復合處理時,可溶性蛋白含量在低濃度脅迫時,基本保持穩(wěn)定或略有升高,之后,除單一Hg2+處理6h時蛋白質含量隨金屬離子濃度增加而緩慢下降外,其他均隨著時間的延長和金屬離子濃度的增加而較大幅度下降;在單一Cd2+處理時,可溶性蛋白含量在≤10 µ mol/L濃度時穩(wěn)定或升高,之后相
61、對較緩慢地降低。經回歸分析,蛋白質含量與金屬離子的濃度在Hg2+脅迫24h、Cd2+脅迫72h、以及復合脅迫24h和72h時呈明顯負相關;其決定系數(shù)R2的范圍是0.684~0.763(P<0.05)。,案例17(初稿:續(xù)4),2.5對苦草POD活性的影響由圖5可知,在Hg2+和Hg2++Cd2+復合脅迫時,6h時POD活性穩(wěn)定或隨金屬離子濃度的增加而緩慢上升,24h時先明顯升高,在Hg2+=10 µ mol/L、Hg2
62、++Cd2+=20 µ mol/L時達最高,之后下降,72h時金屬離子濃度在5µ mol/L前明顯上升,之后下降至最低。兩者間的變化趨勢相似,即隨著脅迫濃度和時間的增加,POD的活性逐步增大,超過一定限度后,開始降低。而在Cd2+單一脅迫下,POD活性除在最高濃度和最長時間脅迫(即最大脅迫)下略有降低外,均隨脅迫強度的增加而增加。經相關分析,在Hg2+脅迫72h時,POD活性與金屬離子濃度間顯著負相關(決定系數(shù)R2=
63、0.773,P<0.05),在Cd2+脅迫6和24h,Hg2++Cd2+復合脅迫6h時,POD活性與金屬離子濃度間顯著正相關,決定系數(shù)R2分別為0.989,0.994(P<0.01)和0.774(P<0.05)。,案例17(初稿:續(xù)5),2.6對苦草SOD活性的影響由圖6可知,SOD活性與POD活性的變化趨勢基本一致,但在40µ mol/L 的Hg2+和Hg2++Cd2+復合脅迫6h時,SOD活性是降低的。
64、經相關分析,在Cd2+脅迫6和24h時,SOD活性與金屬離子濃度間顯著正相關(決定系數(shù)R2分別為0.899,0.86,P<0.01)。,案例17(初審意見),案例17來稿之初審結果:修改后送審修改意見:5)第2.1節(jié)“經相關分析,現(xiàn)存量增加百分比與金屬離子濃度間顯著負相關,其決定系數(shù)R2(2是上角標)分別為0.893,0.87,0.886,P<0.05?!边@段文字存在常識性錯誤。相關分析計算的是“相關系數(shù)”(其符號是r)
65、而不是 “決定系數(shù)”(符號是R2(2是上角標)),決定系數(shù)是回歸分析中應計算的統(tǒng)計參數(shù)。作者進行的是相關分析還是回歸分析?此外,按照數(shù)理統(tǒng)計常識,關于相關系數(shù),有Pearson 相關系數(shù),還有Spearman或Kendall秩相關系數(shù)。如果沒有特別指出,r就是Pearson 相關系數(shù)。但是,Pearson 相關系數(shù)僅在樣本數(shù)據(jù)的分布服從正態(tài)分布時才有意義。如果樣本數(shù)據(jù)不服從正態(tài)分布,則必須計算Spearman或Kendall秩相關系數(shù)。
66、請作者確認,你計算的是否為Pearson 相關系數(shù)?如果是,則請報告正態(tài)分布檢驗結果,以證明計算此相關系數(shù)是妥當?shù)?。按?guī)定需要作者報告相關分析時使用的統(tǒng)計軟件(如SPSS,SAS)……,案例17(修改結果),2.2 測試指標與方法 ……實驗結果為三次平均值。用Spss11.5軟件進行相關分析,采用Kendall相關系數(shù)。,案例17(修改結果:續(xù)1),3 結果(Results)3.1 苦草現(xiàn)存量增加百分比的變化由圖1可知,在Hg2
67、+、Cd2+和Hg2++Cd2+三種脅迫下,苦草的現(xiàn)存量增加百分比均隨著金屬離子濃度的增加而下降,其中在Hg2+或Hg2++Cd2+ >5 µ mol·L-1時急劇下降,即快速致死,而在Cd2+脅迫下,現(xiàn)存量增加百分比隨脅迫程度的增加呈逐步下降趨勢,說明Hg2+和Hg2++Cd2+復合對苦草的毒性遠大于Cd2+。經相關分析,現(xiàn)存量增加百分比與金屬離子濃度間極顯著負相關,其相關系數(shù)r分別為-0.933**,-0.
68、945**,-0.941**(*為顯著,**為極顯著,下同)。,案例17(修改結果:續(xù)2),3.2 對苦草光合與呼吸作用的影響苦草的Pg、Pn、R是隨著金屬離子濃度的增加而下降(圖2)。三者與金屬離子濃度間顯著或極顯著負相關,其相關系數(shù)r的范圍是-0.600*~-0.966**。 3.3 對苦草葉綠素含量的影響3種處理均導致葉綠素含量隨著時間的延長和金屬離子濃度的增加而降低,但略有波動(圖3)。在低濃度脅迫時(≤2.5 µ
69、; mol·L-1,下同)葉綠素含量升高(Hg2+處理72h時降低),之后較明顯地降低;葉綠素含量與金屬離子的濃度除Hg2+脅迫6、24h和Cd2+脅迫6h外,其他顯著或極顯著負相關;其相關系數(shù)r的范圍是-0.690*~-969**。,案例17(修改結果:續(xù)3) 3.4對苦草可溶性蛋白濃度的影響,總體上看,3種處理均導致苦草可溶性蛋白含量隨著時間的延長和金屬離子濃度的增加而明顯降低,但略有波動(圖4)。在單一Hg2+和復合處
70、理時,可溶性蛋白含量在低濃度脅迫時,基本保持穩(wěn)定或略有升高,之后,除單一Hg2+處理6h時蛋白質含量隨金屬離子濃度增加而緩慢下降外,其他均隨著時間的延長和金屬離子濃度的增加而較大幅度下降;在單一Cd2+處理時,可溶性蛋白含量在≤10 µ mol·L-1濃度時穩(wěn)定或升高,之后相對較緩慢地降低。經相關分析,蛋白質含量與金屬離子的濃度在Hg2+脅迫24、72h,復合脅迫6、24和72h時極顯著負相關,相關系數(shù)r的范圍是-0
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 學術論文中常用數(shù)理統(tǒng)計方法的正確使用問題
- 學術論文中常用數(shù)理統(tǒng)計方法的正確使用問題
- 學術論文中常用數(shù)理統(tǒng)計方法的正確使用問題
- 應用數(shù)理統(tǒng)計matlab使用入門
- 用數(shù)理統(tǒng)計方法分析試卷質量.pdf
- 數(shù)理統(tǒng)計
- 數(shù)理統(tǒng)計
- 數(shù)理統(tǒng)計考試
- 數(shù)理統(tǒng)計1.1
- 數(shù)理統(tǒng)計習題
- 研究經濟學的數(shù)理統(tǒng)計方法
- 數(shù)據(jù)分析的統(tǒng)計方法選擇小結
- 《醫(yī)藥數(shù)理統(tǒng)計方法》中藥專業(yè)
- 數(shù)理統(tǒng)計 ppt課件
- 數(shù)理統(tǒng)計課件全集
- 數(shù)理統(tǒng)計作業(yè)答案
- 數(shù)理統(tǒng)計課后答案
- 數(shù)理統(tǒng)計答案整理
- 數(shù)理統(tǒng)計習題作業(yè)
- 互聯(lián)電網實際運行數(shù)據(jù)的數(shù)理統(tǒng)計分析.pdf
評論
0/150
提交評論