版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、第十一章 相關(guān)與回歸分析,變量間關(guān)系的度量一元線性回歸分析,第一節(jié) 變量間關(guān)系的度量,變量間的關(guān)系相關(guān)關(guān)系的描述與測度,一、變量間的關(guān)系,在生產(chǎn)經(jīng)營活動中,我們經(jīng)常要對變量之間的關(guān)系進(jìn)行分析。比如,在企業(yè)生產(chǎn)中,我們要對影響生產(chǎn)成本的各種因素進(jìn)行分析,以達(dá)到控制成本的目的;在農(nóng)業(yè)生產(chǎn)中,我們需要研究農(nóng)作物產(chǎn)量與施肥量的關(guān)系,以便分析施肥量對產(chǎn)量的影響,進(jìn)而確定合理的施肥量;商業(yè)活動中,我們需要分析廣告費(fèi)支出與銷售量之間的關(guān)系,進(jìn)而
2、通過廣告費(fèi)支出來預(yù)測銷售量等。變量之間的關(guān)系形態(tài)可分為兩種類型:函數(shù)關(guān)系和相關(guān)關(guān)系。,,我們比較熟悉的,一、變量間的關(guān)系,例1:某種產(chǎn)品的銷售額和銷售量之間的關(guān)系。設(shè)銷售額為y,銷售量為x,銷售價(jià)格為p,則x與y之間的關(guān)系可表示為y=px。這就是說,在銷售價(jià)格不變的情況下,對于該商品的某一銷售量,總有一個(gè)銷售額與之對應(yīng),即銷售額完全由銷售量所確定,二者之間為線性函數(shù)關(guān)系。,例2:企業(yè)的原材料消耗額(y)與產(chǎn)量(x1),單位產(chǎn)品消耗(x
3、2),原材料價(jià)格(x3)之間的關(guān)系可表示為y=x1x2x3。這里的y與x1、x2、x3之間是一種確定的函數(shù)關(guān)系,但它們不是線性函數(shù)關(guān)系。,函數(shù)關(guān)系是一一對應(yīng)的確定關(guān)系。,但實(shí)際問題中,變量之間的關(guān)系往往不那么簡單?! ±纾何覀兛疾旒彝π钆c家庭收入這兩個(gè)變量,它們之間不存在完全確定的關(guān)系。,定義1:我們把變量之間存在的不確定的數(shù)量關(guān)系稱為相關(guān)關(guān)系。,例3:從遺傳學(xué)角度看,子女的身高(y)與其父母的身高(x)有很大關(guān)系?! ?/p>
4、一般來說,父母身高較高時(shí),其子女的身高通常也高,父母身高較低時(shí),其子女的身高通常也較低。但實(shí)際情況并不完全如此,因?yàn)樗鼈冎g不是完全確定的關(guān)系。顯然,子女的身高并不完全由父母身高一個(gè)因素所決定,還受其他許多因素的影響,因此二者之間屬于相關(guān)關(guān)系。,總結(jié):從上面的例子可以看出,相關(guān)關(guān)系的特點(diǎn)是:一個(gè)變量的取值不能由另一個(gè)變量唯一確定,當(dāng)變量x取某個(gè)值時(shí),變量y的取值可能有幾個(gè)。對這種關(guān)系不確定的變量顯然不能用函數(shù)關(guān)系進(jìn)行描述,但也不是無規(guī)律
5、可循。,通過大量數(shù)據(jù)的觀察與研究,我們會發(fā)現(xiàn)許多變量之間確定存在著一定的客觀規(guī)律。如:平均來說,父母身高較高時(shí),其子女的身高一般也較高;收入水平高的家庭,其家庭儲蓄一般也較多。,相關(guān)與回歸分析正是描述與探索這類變量之間關(guān)系及其規(guī)律的統(tǒng)計(jì)方法。,二、相關(guān)關(guān)系的描述與測度,(一)散點(diǎn)圖(二)相關(guān)系數(shù),(一)散點(diǎn)圖,相關(guān)分析就是對兩個(gè)變量之間線性關(guān)系的描述與度量。對于兩個(gè)變量x和y,通過觀察或試驗(yàn)我們可以得到若干組數(shù)據(jù),記為(xi,yi)(
6、i=1,2,3…)。相關(guān)分析所要解決的問題是,根據(jù)這些數(shù)據(jù)確定變量之間是否存在相關(guān)關(guān)系,如果存在的話,如何描述出它們之間的關(guān)系并對其關(guān)系強(qiáng)度進(jìn)行測度。,定義2:用坐標(biāo)的水平軸代表變量x,縱軸代表因變量y,每組數(shù)據(jù)( xi,yi)在坐標(biāo)系中用一個(gè)點(diǎn)表示,n組數(shù)據(jù)在坐標(biāo)系中形成的n個(gè)點(diǎn)稱為散點(diǎn),由坐標(biāo)及散點(diǎn)形成的二維數(shù)據(jù)圖稱為散點(diǎn)圖。,(e)非線性相關(guān),(f )不相關(guān),不同形態(tài)的散點(diǎn)圖,例:一家大型商業(yè)銀行在多個(gè)地區(qū)設(shè)有分行,其業(yè)務(wù)主要是
7、進(jìn)行基礎(chǔ)設(shè)施建設(shè)、國家重點(diǎn)項(xiàng)目建設(shè)、固定資產(chǎn)投資等項(xiàng)目的貸款。近年來,該銀行的貸款額平穩(wěn)增長,但不良貸款額也有較大比例提高,這給銀行業(yè)務(wù)的發(fā)展帶來壓力。為弄清楚不良貸款形成的原因,研究人員希望利用銀行業(yè)務(wù)的有關(guān)的有關(guān)數(shù)據(jù)作些定量分析,以便找出控制不良貸款的辦法。下表是該銀行所屬25家分行2002年的有關(guān)業(yè)務(wù)數(shù)據(jù)。,某商業(yè)銀行2002年的主要業(yè)務(wù)數(shù)據(jù),,研究人員想知道,不良貸款是否與與貸款余額、應(yīng)收貸款,貸款項(xiàng)目的多少、固定資產(chǎn)投資等因素
8、有關(guān)?是什么樣的關(guān)系?關(guān)系強(qiáng)度如何?,由散點(diǎn)圖可以看出:不良貸款與貸款余額、應(yīng)收貸款、貸款項(xiàng)目個(gè)數(shù)、固定資產(chǎn)投資額之間都具有一定的線性關(guān)系,但從各散點(diǎn)的分布情況看,與貸款余額線性關(guān)系比較密切,而與固定資產(chǎn)投資額關(guān)系最不密切。,(二)相關(guān)系數(shù),通過散點(diǎn)圖可以判斷兩個(gè)變量之間有無相關(guān)關(guān)系,并對變量間的關(guān)系形態(tài)作出大致描述,但散點(diǎn)圖不能準(zhǔn)確反映變量之間的關(guān)系密切程度。因此,為準(zhǔn)確度量兩個(gè)變量之間的關(guān)系密切程度,需要計(jì)算相關(guān)系數(shù)。,定義3:根據(jù)
9、樣本數(shù)據(jù)計(jì)算的對兩個(gè)變量之間線性關(guān)系強(qiáng)度的度量值,稱為相關(guān)系數(shù)。若相關(guān)系數(shù)是根據(jù)總體全部數(shù)據(jù)計(jì)算的,稱為總體相關(guān)系數(shù),記為ρ;若是根據(jù)樣本數(shù)據(jù)計(jì)算的,則稱為樣本相關(guān)系數(shù),記為r。樣本相關(guān)系數(shù)的計(jì)算公式為:,簡化公式為:,例:根據(jù)表中數(shù)據(jù),計(jì)算不良貸與貸款余額之間的相關(guān)系數(shù)。,各相關(guān)系數(shù)的各數(shù)值說明了什么?,可以證明:相關(guān)系數(shù)的取值范圍在+1~-1之間,即-1≤r≤1。若0<r≤1,x與y之間存在正線性相關(guān)關(guān)系;-1≤r<0,x與y
10、之間存在負(fù)線性相關(guān)關(guān)系;r=+1,表明x與y之間為完全正線性相關(guān)關(guān)系;r=-1,表明x與y之間為完全負(fù)線性相關(guān)關(guān)系;r=0時(shí),表示兩個(gè)變量不存在線性相關(guān)關(guān)系。,注:r=0只表示兩個(gè)變量之間不存在線性相關(guān)關(guān)系,并不說明變量之間沒有任何關(guān)系,比如它們之間可能存在非線性相關(guān)關(guān)系。|r| 1,說明變量之間線性關(guān)系越密切。,,|r|≥0.8時(shí),可視為高度相關(guān),0.5≤|r|<0.8時(shí),可視為中度相關(guān); 0.3≤|r|<0.5時(shí),視為
11、低度相關(guān); |r|<0.3時(shí),說明兩個(gè)變量之間的相關(guān)程度極弱,可視為不相關(guān)。,三、相關(guān)關(guān)系的顯著性檢驗(yàn),一般情況下,總體相關(guān)系數(shù)ρ是未知的,通常是根據(jù)樣本相關(guān)系數(shù)r作為ρ的近似估計(jì)值。由于r是根據(jù)樣本數(shù)據(jù)計(jì)算出來的,它受到抽樣波動的影響,由于抽取的樣本不同,r取值不同,因此r是一個(gè)隨機(jī)變量。,注:能否根據(jù)樣本相關(guān)系數(shù)說明總體的相關(guān)程度呢?這就需要考察樣本相關(guān)系數(shù)的可靠性,也就是需要考察樣本相關(guān)系數(shù)的可靠性,也就是顯著性檢驗(yàn)。,第二節(jié)
12、一元線性回歸分析,相關(guān)分析 的目的在于測度變量之間的關(guān)系密切程度,它所使用的測度工具就是相關(guān)系數(shù)。回歸分析側(cè)重于考察變量之間的數(shù)量伴隨關(guān)系,并通過一定的數(shù)學(xué)表達(dá)式將這種關(guān)系描述出來,進(jìn)而確定一個(gè)或幾個(gè)變量(自變量)的變化對另一個(gè)特定變量(因變量)的影響程度。,一、一元線性回歸模型二、參數(shù)的最小二乘估計(jì),一、一元線性回歸模型,(一)回歸模型(二)回歸方程,(一)回歸模型,定義4:在回歸分析中,被預(yù)測或被解釋的變量,稱為因變量,用y表
13、示。定義5:在回歸分析中,用來預(yù)測或用來解釋因變量的一個(gè)或多個(gè)變量,稱為自變量,用x表示。,例如:在分析貸款余額對不良貸款的影響時(shí),我們的目的是預(yù)測一定的貸款余額條件下的不良貸款是多少。因此不良貸款是被預(yù)測的變量,稱為因變量,而用來預(yù)測不良貸款的貸款余額就是自變量。,定義6:在回歸分析中,只涉及一個(gè)自變量的回歸,稱為一元回歸,若因變量y與自變量x之間為線性關(guān)系時(shí)稱為一元線性回歸。定義7:描述因變量y如何依賴于自變量x和誤差項(xiàng)ε的方程
14、,稱為回歸模型。,對于只涉及一個(gè)自變量的一元線性回歸模型可表示為:y=β0+β1x+ ε,,反映了由于x的變化而引起的y 的線性變化;,,稱為誤差項(xiàng),是一個(gè)隨機(jī)變量,它反映了除x和y之間的線性關(guān)系之外的隨機(jī)因素對y的影響,是不能由x與y之間的線性關(guān)系所解釋的變異性,,β0、β1稱為模型的參數(shù),,以上模型有三個(gè)假定: (1)誤差項(xiàng)是一個(gè)期望值為零的正態(tài)分布隨機(jī)變量,并且ε相互獨(dú)立。 (2)當(dāng)x固定為某一值xi時(shí),y為正態(tài)分布的隨
15、機(jī)變量,即y~N(β0+β1xi, σ2)(3)y的方差σ2是一個(gè)不變的常量; (4)每一對觀察數(shù)據(jù)(xi, yi )和另一對觀察數(shù)據(jù)( xi, yi )都是相互獨(dú)立地進(jìn)行觀察所得到的。,,獨(dú)立性意味著對于一個(gè)特定的x值,它所對應(yīng)的ε與其他x值對應(yīng)的ε不相關(guān)。,(二)回歸方程,根據(jù)回歸方程中的假定,ε的期望值等于零,因此y的期望值E(y)= β0+β1x,也就是說y的期望值是x的線性函數(shù)。,定義8:描述因變量y的期望值如何依賴于自
16、變量x的方程,稱為回歸方程。一元線性回歸方程的形式為: E(y)= β0+β1x一元線性回歸方程的圖示是一條直線,因此也稱為直線回歸方程。,,β0為回歸直線在y軸上的截距, 當(dāng)x=0時(shí)y的期望值,,β1為直線的斜率,它表示當(dāng)x每變動一個(gè)單位時(shí),y的平均變動值。,(三)估計(jì)的回歸方程,如果回歸方程中的參數(shù)β0和β1已知,對于一個(gè)給定的x值,利用式E(y)= β0+β1x可以計(jì)算出y的期望值。但回歸參數(shù)β0和β1是未
17、知的,我們必須利用樣本數(shù)據(jù)去估計(jì)它們。用樣本統(tǒng)計(jì)量 β0和β1代替回歸方程中的未知參數(shù)β0和β1 ,這時(shí)我們就得到了估計(jì)的回歸方程。,,,,,定義9:利用最小二乘法,根據(jù)樣本數(shù)據(jù)求出的回歸方程的估計(jì),稱為估計(jì)的回歸方程。對于一元線性回歸,估計(jì)的回歸方程形式如下: y= β0+β1x,,,,,,,,β0為估計(jì)的回歸直線在y 軸上的截距,,β1為直線的斜率,它表示對于一個(gè)給定的x值,y是y的估計(jì)值,,,,,,,二、參數(shù)的最小二乘估計(jì),對于
18、x和y的n對觀察值,用于描述其關(guān)系的直線有多條,究竟用哪直線來代表兩個(gè)變量之間的關(guān)系,需要有一個(gè)明確的原則。我們采用距離各觀察點(diǎn)最近的一條直線來代表x與y之間的關(guān)系。最小二乘法是使因變量的觀察值yi與估計(jì)值yi之間的離差平方和達(dá)到最小來求得β0和β1的方法。即,,,,,,,定義10:使因變量的觀察值與估計(jì)值之間的離差平方和達(dá)到最小來求得β0和β1的方法,稱為最小二乘法。,令Q= ,求使
19、用權(quán)Q最小的β0和β1值,,例:根據(jù)數(shù)據(jù),求不良貸款對貸款余額的估計(jì)方程。 解:根據(jù)公式: 即不良貸款對貸款余額的估計(jì)方程為: y=-0.8295+0.037895x。 回歸系數(shù)β1=0.037895, 表示貸款余額每增加1億元,不良貸款平均增加0.037895億元。將xi的各個(gè)取值代入上述估計(jì)方程,可
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
評論
0/150
提交評論