第1章雙變量回歸分析

上傳人：奔*** IP屬地：河北更新時(shí)間：2024-01-06 格式：ppt 頁數(shù)：50 大?。?98.50KB 人氣指數(shù)：12 舉報(bào) 版權(quán)申訴

已閱讀1頁，還剩49頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第一章雙變量回歸分析,教師：盧時(shí)光,1. 回歸分析的性質(zhì),F.加爾頓（Francis Galton）發(fā)現(xiàn)，雖然有一個趨勢：父母高，兒女也高；父母矮，兒女也矮，但給定父母的身高，兒女輩的平均身高卻趨向于或者“回歸”到全體人口的平均身高。K.皮爾遜（Karl Pearson）證實(shí)了加爾頓普遍回歸定律。皮爾遜收集了1000多個家庭的身高記錄。他發(fā)現(xiàn)對于父輩高的群體，兒輩的平均身高低于他們的父輩，而對于父輩矮的群體，兒輩的平均身高則高于他們

2、的父輩。用加爾頓的話來說，就是“回歸到中等（regression to mediocrity）”。,1.2 回歸的現(xiàn)代定義回歸分析是關(guān)于研究一個應(yīng)變量對另一個解釋變量的依賴關(guān)系，其用意在于通過后者（在重復(fù)抽樣中）的已知或設(shè)定值，去估計(jì)和（或）預(yù)測前者的（總體）均值?；氐郊訝栴D的例子：我們關(guān)心給定父輩身高，找出兒輩平均身高的變化。值得注意的是，隨著父輩身高的增加，兒輩平均身高也在增加。,如左圖所示：注意對應(yīng)任一給定的父輩的身高，都有

3、一個兒輩身高的分布范圍。我們勾畫了一條通過這些散點(diǎn)的一條直線，以表示兒輩平均身高如何隨父輩身高的增加而增加的。這條線我們稱為回歸線（regression line）。,1.3 統(tǒng)計(jì)關(guān)系和確定性關(guān)系如上例中，我們不像經(jīng)典物理學(xué)中考慮的那種變量之間的函數(shù)或確定性依賴關(guān)系。在回歸分析中，我們考慮的是一類所謂統(tǒng)計(jì)依賴關(guān)系。在變量之間的統(tǒng)計(jì)關(guān)系中，我們主要處理是隨機(jī)變量，也就是有著概率分布的變量。例如，作物收成對氣溫、降水、陽光及施肥的依賴關(guān)

4、系是統(tǒng)計(jì)性質(zhì)的。這個性質(zhì)的意義在于：這些解釋變量固然重要，但是并不能夠使農(nóng)業(yè)學(xué)家準(zhǔn)確地預(yù)測作物的收成。一則這些變量的測量是有誤差的，二則還有一大堆影響到作物收成的變量，我們無法一一識別出來。,1.4 回歸和因果關(guān)系雖然回歸分析是研究一個變量對另一些變量的依賴關(guān)系，但它并不一定意味著因果關(guān)系。用肯達(dá)爾和斯圖亞特的話說：“一個統(tǒng)計(jì)關(guān)系式，無論多強(qiáng)也不管多么有啟發(fā)性，卻永遠(yuǎn)不能確立因果方面的聯(lián)系，對因果關(guān)系的理念，必須來自統(tǒng)計(jì)學(xué)以外，最終來

5、自這種或那種理論?！崩缭谥T多有趣的經(jīng)濟(jì)指標(biāo)中有一個“裙子長短指數(shù)”。這個指數(shù)用女性穿著裙子的長短來判斷經(jīng)濟(jì)的好壞。當(dāng)經(jīng)濟(jì)不好時(shí)，失業(yè)率增加，女性就業(yè)更困難，短裙看起來能年輕、活力一些，有利于尋求新的職位。但是我們不能因此得到結(jié)論：在座的女生穿著短裙是因?yàn)榻?jīng)濟(jì)不好，或者因?yàn)樵谧呐┲倘顾灾袊慕?jīng)濟(jì)不好。從邏輯上說，統(tǒng)計(jì)關(guān)系式本身不意味著任何因果關(guān)系。,1.5 數(shù)據(jù)的性質(zhì)用于經(jīng)濟(jì)分析的數(shù)據(jù)有三類：時(shí)間序列、橫截面數(shù)據(jù)、和混合

6、數(shù)據(jù)。時(shí)間序列：對一個變量在不同時(shí)期取值的一組觀測結(jié)果。例如隨著年份GDP的變換、上證綜合指數(shù)的每日變換等等?；跁r(shí)間序列數(shù)據(jù)的計(jì)量分析，大多假定所依據(jù)的時(shí)間序列數(shù)據(jù)是平穩(wěn)的（stationary）。粗略地來說，如果一組時(shí)間序列數(shù)據(jù)，它們的均值和方差在時(shí)間上沒有系統(tǒng)的變化，就是平穩(wěn)的。要記?。好慨?dāng)你使用時(shí)間序列數(shù)據(jù)時(shí)，你都要問一問它的平穩(wěn)性如何。,橫截面數(shù)據(jù)：對一個或多個變量在同一個時(shí)點(diǎn)上收集的數(shù)據(jù)。例如2012年9月份，全國主要3

7、0個省份的生豬的產(chǎn)量和價(jià)格、全國每個高校2012屆大學(xué)生的就業(yè)率等等。橫截面數(shù)據(jù)也有其自身的問題，特別是異方差（heterogeneity）的問題。有的?。ê稀⒔鳎┥a(chǎn)巨量的生豬，而有的?。ū本┖蛷V東）生產(chǎn)量很少。當(dāng)我們的統(tǒng)計(jì)分析中包含有相異的單元時(shí)，我們必須考慮尺度效應(yīng)，以避免把蘋果和桔子混同了起來。混合數(shù)據(jù)：兼有時(shí)間序列和橫截面數(shù)據(jù)。例如人口普查數(shù)據(jù)，從1980到2012年中國人口總量變化是時(shí)間序列，而2012年不同省市人口

8、的分布則是橫截面數(shù)據(jù)。,2. 雙變量回歸分析,2.1 一個例子假定一個國家人口總體由60戶家庭組成，X表示家庭周可支配收入，Y表示家庭周消費(fèi)支出。,將這60戶按照收入劃分為10組，分析每一組的家庭消費(fèi)支出。對應(yīng)每周收入在80美元的5戶，每周家庭消費(fèi)支出在55到75美元不等。上表中，每一縱列給出的是在給定的收入水平X下的消費(fèi)支出Y的分布。就是說，它給出了以X為給定值條件下的Y的條件分布。散點(diǎn)圖根據(jù)表格的數(shù)據(jù)制成。,現(xiàn)在，對于給定的X，

9、例如X=80美元，有5個Y值：55、60、65、70和75美元。因此給定X=80得到這些消費(fèi)支出中任何一個概率是1/5。用符號來表示：對于Y的每一條件概率分布，我們能夠計(jì)算出來它的均值，稱為條件均值或條件期望，記做E(Y|X=Xi)，并讀作“在X取特定Xi值時(shí)Y的期望值”。給定X=80，Y的期望或條件均值為：,回到散點(diǎn)圖中，我們更清楚的發(fā)現(xiàn)，雖然，每個家庭的消費(fèi)支出都不相同，但隨著收入的增加，消費(fèi)水平平均地說也在增加。觀測紅色的

10、粗圓點(diǎn)代表的Y的各個條件均值，這種察覺就更加的直觀和形象。散點(diǎn)圖表明，這些條件均值都落在一個有正斜率的直線上。這個直線叫做總體回歸線。更簡單地說，它是Y對X的回歸。,在幾何意義上，總體回歸線就是當(dāng)解釋變量取給定值時(shí)，應(yīng)變量的條件均和或期望的軌跡。,2.2總回歸函數(shù)（PRF）從前面的討論中，我們清楚地看到，每一條件均值E(Y|Xi)都是Xi的一個函數(shù)，用符號來表示：其中，f(Xi)表示解釋變量Xi的某個函數(shù)（在上例中， E(Y|Xi

11、) 是Xi的一個線性函數(shù)），我們把稱為總體回歸函數(shù)（PRF）或簡稱為總體回歸（PR）。它說明在給定的Xi下，Y的分布均值與Xi有函數(shù)關(guān)系，或者，它表明了Y的均值是怎樣隨X而變化的。PRF的函數(shù)形式是一個經(jīng)驗(yàn)方面的問題，例如，經(jīng)濟(jì)學(xué)家會提出消費(fèi)和收入有線性關(guān)系，這樣PRF常常被寫作其中β1β2為不知的參數(shù)，稱為回歸系數(shù)，也分別被稱為截距和斜率系數(shù)。,2.3 線性的含義對線性的第一種解釋是，Y的條

12、件期望是Xi的線性函數(shù)，從幾何意義上來看，這時(shí)回歸曲線是一條直線。按照這種解釋，諸如E(Y|Xi)= β1+β2+Xi2回歸函數(shù)，變量X以指數(shù)2出現(xiàn)，就不是線性的。對線性的第二種解釋是，Y的條件期望E(Y|Xi)是諸參數(shù)β的一個線性函數(shù)，它可以是也可以不是X的線性函數(shù)。這樣E(Y|Xi)= β1+β2Xi2就算一個線性模型，而E(Y|Xi)= β1+β22Xi2則不是。在我們這里，我們認(rèn)為“線性”是對參數(shù)為線性的情形，因此，從現(xiàn)在開

13、始“線性”一詞總是指對參數(shù)β為線性的一種回歸（即參數(shù)總是以它的1次方出現(xiàn)）；對解釋變量X則可以是或不是線性的。 E(Y|Xi)= β1+β2Xi和E(Y|Xi)= β1+β2Xi2都是線性回歸模型（LRM）。,2.4 總回歸方程的隨機(jī)設(shè)定前面的例子中，隨著家庭收入的增加，家庭消費(fèi)支出平均的也增加。但是對個單獨(dú)某個家庭來說，消費(fèi)支出水平卻不一定隨收入水平增加而增加。例如，對應(yīng)于每周100美元的收入水平，有一家庭的消費(fèi)支出是65美元，而對

14、應(yīng)于收入80美元的兩戶家庭，消費(fèi)支出為70和75美元。那么，在個別家庭的消費(fèi)支出與給定的收入水平之間存在什么關(guān)系呢？我們在前面的分析中看到，給定收入水平Xi的個別家庭的消費(fèi)支出圍繞在收入為Xi的所有家庭的平均消費(fèi)支出的周圍，也就是圍繞在它的條件均值。因此我們可以把個別家庭的Yi圍繞在它的期望值的離差（deviation）表述如下：,ui被稱為隨機(jī)干擾或隨機(jī)誤差項(xiàng)。給定X水平，個別家庭的支出可以表示為兩個成分之和（1） E(Y|Xi)

15、代表相同收入水平的所有家庭的平均消費(fèi)支出，這個成分被稱為系統(tǒng)性或確定性成分，以及（2） ui被稱為隨機(jī)的或非系統(tǒng)性的成分。也可以理解為ui是所有影響Y的，但是沒能包含到回歸方程中的，被忽略變量的替代變量。方程：表示一個家庭的消費(fèi)支出，線性地依賴于它收入加上干擾項(xiàng)。給定X=80，各個家庭的消費(fèi)支出表達(dá)為：,回到剛才的式子：現(xiàn)在，如果兩邊取期望，則：式中， E(Y|Xi)是條件期望，是一個常數(shù)，故E[E(Y|Xi)

16、]就是它自身。而E(Yi|Xi)就是E(Y|Xi)，故：因此，假定回歸線從Y的條件均值通過，就意味著，ui的（以給定的Xi為條件的）條件均值為零。,2.5 隨機(jī)干擾項(xiàng)的意義干擾項(xiàng)是從模型中沒有包含的而又集體地影響著Y的全部變量的替代物。為什么我們不構(gòu)造一個包含盡可能多的變量的復(fù)回歸模型？理由如下：1.理論的含糊性；2.數(shù)據(jù)的欠缺；3.核心變量和周邊變量；4.人類行為的內(nèi)在隨機(jī)性；5.“不好的”替代變量；6.節(jié)省的原則

17、；7.錯誤的函數(shù)形式。為了所有上述理由，我們在隨后的學(xué)習(xí)中會發(fā)現(xiàn)，隨機(jī)干擾項(xiàng)在回歸分析中扮演了極其重要的角色。,2.6 樣本回歸函數(shù)（SRF）注意我們前面的例子中，我們假定一個國家是由60戶家庭組成的，故我們得到的是一個關(guān)于這60戶家庭收入和消費(fèi)支出的完整的總體數(shù)據(jù)。在大多數(shù)實(shí)際情況下，我們僅有對應(yīng)于某些固定的X的Y值的樣本，這樣我們就必須面對抽樣問題，例如有下列兩組抽樣數(shù)據(jù)：,問題：我們能夠從抽樣數(shù)據(jù)中預(yù)測整個總體中對應(yīng)于給定

18、的X的平均每周消費(fèi)支出Y嗎？將表中的數(shù)據(jù)描繪為散點(diǎn)圖：,在散點(diǎn)圖中，我們畫了兩根樣本回歸線以盡量好的擬合這些散點(diǎn)。SRF1是根據(jù)第一個樣本的數(shù)據(jù)，而SRF2是根據(jù)第二個樣本的數(shù)據(jù)。那么，兩條回歸線中那一條代表“真實(shí)”的總體樣本回歸線？事實(shí)上，我們不可能有絕對把握知道哪一條代表了真實(shí)的總體回歸線。因?yàn)槌闃拥牟▌?，它們最多也不過是真實(shí)總體回歸線的一個逼近而已。一般的來說，從N個不同樣本中會得到N個不同的樣本回歸函數(shù)，并且這些樣本回歸函數(shù)

19、不大會一樣。類比總體回歸函數(shù)，我們能夠?qū)懗鲆粋€代表樣本回歸線的樣本回歸函數(shù)（SRF）：這里分別是Y，β1和β2的估計(jì)量。,我們還能把SRF表達(dá)為它的隨機(jī)形式：其中，除了定義過的符號外，表示樣本殘差項(xiàng)。概念上，類似于ui,并且可把它當(dāng)做是ui的估計(jì)量，把它引入到SRF中的理由和把ui引入PRF中來，是出于同一個理由。至此，總的來說，回歸分析僅僅是依據(jù)某總體的一個樣本的時(shí)候比不是這樣的

20、時(shí)候多。我們的主要目的是根據(jù)樣本回歸函數(shù)（SRF）：來估計(jì)總體樣本函數(shù)（PRF）：,對于X=Xi，我們有一個觀測值Y=Yi。我們可以根據(jù)SRF將所觀測的Yi表達(dá)為：也可以根據(jù)PRF，表達(dá)為：現(xiàn)在，對于圖中所示的Xi，明顯過高的估計(jì)了那里的真實(shí)的E(Y|Xi)，類似的對于A點(diǎn)左側(cè)，SRF低估了真實(shí)的PRF，而右側(cè)則恰好相反。,現(xiàn)在，重要的問題：既然認(rèn)識到了樣本回歸函數(shù)不過是總體回歸函數(shù)的一個近似，能不能設(shè)計(jì)一種規(guī)則或方

21、法，使得這種近似是一種盡可能“接近”的近似？盡管真實(shí)的總體回歸函數(shù)永遠(yuǎn)不得而知。,3. 雙變量回歸模型：估計(jì)問題,3.1 普通最小二乘法原理回顧雙變量總體回歸函數(shù)（PRF）：這個PRF不是直接可以觀測的。我們通過樣本回歸函數(shù)（SRF）去估計(jì)它：這里，是Y的估計(jì)值（條件均值）。,我們把式子改寫為：這樣殘差不過是實(shí)際Y值與估計(jì)值之間的差。對于給定的Y和X，我們希望樣本回歸函數(shù)（SRF）能夠盡

22、可能的接近實(shí)際的Y，這樣我們采用如下原則：選擇這樣的SRF，使得盡可能的小。,上述標(biāo)準(zhǔn)似乎很給力，但卻存在缺陷。因?yàn)樵诳偤停褐校?得到的權(quán)重和一樣多，而顯然后兩者離樣本回歸線距離要遠(yuǎn)得多。這樣可能所有的都散布的很遠(yuǎn)，但是代數(shù)和卻很?。ㄉ踔翞榱悖?。為了避免這樣的問題，最小二乘準(zhǔn)則要給出樣本回歸函數(shù)（SRF），使得：盡可能小，其中是殘差平方和。我們即將看到，

23、它得出來的估計(jì)量有很好的統(tǒng)計(jì)性質(zhì)。很明顯，殘差平方和是關(guān)于估計(jì)量的某個函數(shù)：,的最小二乘估計(jì)其中，n是樣本大小。這組聯(lián)立方程被稱為正則方程。,解上述方程組：,最小二乘（OLS）估計(jì)量的性質(zhì)OLS估計(jì)量是純粹由可觀測值（樣本值）表達(dá)的，因此這些量是容易計(jì)算的；這些量是點(diǎn)估計(jì)量，對于給定的樣本，每一估計(jì)量僅提供有關(guān)總體參數(shù)的一個值；從樣本數(shù)據(jù)得到OLS估計(jì)值，很容易畫出樣本回歸線，這樣得到的樣本

24、回歸線有如下性質(zhì)（不證明）：1.它通過X和Y的樣本均值；2.估計(jì)的Y均值等于實(shí)測的Y的均值；3.殘差的均值為零；4.殘差和預(yù)測的Yi值不相關(guān)；5.殘差和Xi值不相關(guān)。,3.2經(jīng)典線性回歸模型：最小二乘模型的基本假定如果我們的目的僅僅是估計(jì) ，那么上節(jié)討論的OLS就足夠了。事實(shí)上，我們不僅僅是要估算出的值，而且要對真實(shí)的推斷，我們想知道離它的真期

25、望值有多近。為此，我們要對Yi的產(chǎn)生方式作出某些假設(shè)。而表明，Yi是依賴于Xi和ui。因此除非我們明確Xi和ui是怎樣產(chǎn)生的，我們將無法對Yi作出任何統(tǒng)計(jì)推斷，也就無法對作出統(tǒng)計(jì)推斷。就是說，為了回歸估計(jì)的有效解釋，我們對變量Xi和誤差項(xiàng)ui作出假定是極其重要的。,我們在前面探討過線性的定義，在我們這里我們將始終堅(jiān)持這一定義。,假定1：線性回歸模

26、型?；貧w模型對參數(shù)而言是線性的。,我們關(guān)于總體樣本函數(shù)（PRF）的討論中，隱含著這樣一個假定“重復(fù)抽樣中的固定值”。對它的理解很重要。回到我們最初的例子上：我們假定一個由60戶家庭組成，我們統(tǒng)計(jì)了這60戶家庭的收入X和家庭消費(fèi)支出Y的數(shù)據(jù)。這樣我們把收入值固定在80美元/周，隨機(jī)的抽取一個家庭，并觀測它的周家庭消費(fèi)支出，例如說60美元；接著我們?nèi)匀话咽杖隭固定在80美元/周，再隨機(jī)的抽取令一個家庭，觀測它的周家庭消費(fèi)支出為75美元。在每

27、次抽?。ㄖ貜?fù)抽樣）中，我們都把X值固定在80美元上，直到所有周收入為80美元的家庭統(tǒng)計(jì)完畢。事實(shí)上我們例子中的數(shù)據(jù)就是這樣產(chǎn)生的。所有的這些意味著，我們的回歸分析是條件回歸分析，就是以X給定值為條件的。,假定2：在重復(fù)抽樣中X值是固定的。,假定3：干擾項(xiàng)ui的均值為零。對于給定的X值，ui的條件期望（均值）為零，用公式來表達(dá)：,其實(shí)，這個假定無非是告訴我們，凡是模型中沒有包含的，沒有被作為解釋變量的其他而被歸結(jié)為ui的因素，都不應(yīng)該對

28、Y的均值產(chǎn)生系統(tǒng)性的影響?；蛘哒f，正的ui和負(fù)的ui相互抵消了，以至于它們對Y的平均影響為零。,對于每個ui的方差，都是某個等于δ2的正常數(shù)。意味著，對應(yīng)于不同的X值的Y總體均有相同的方差。圖3.4和3.5都表明了隨收入增加，平均消費(fèi)水平增加。3.4中消費(fèi)支出方差在所有的收入水平下保持不變，而3.5則變大。當(dāng)X=X1時(shí)，消費(fèi)水平平均地離PRF更近，而X=X3時(shí)，消費(fèi)水平圍繞PRF分布更遠(yuǎn)，顯然X=X1時(shí)的數(shù)據(jù)Y對我們來說更可靠一些。

29、,假定4：同方差性或ui的方差相等。對于給定的X值，對所有的觀測，ui的方差是恒定的。用公式來表達(dá)：,假定5：各個干擾項(xiàng)之間無自相關(guān)。給定任意兩個X值：Xi和Xj（i≠j），ui和uj之間的相關(guān)為零。用符號來表示：,用專業(yè)的術(shù)語來說，就是無序列相關(guān)或無自相關(guān)。如果上述假定不成立，ut和ut-1存在相關(guān)關(guān)系，那么Yt不僅僅取決Xt而且還取決于ut，因?yàn)閡t-1在一定程度上決定了ut。我們利用假定5，就是只考慮Xt對Yt的影響，而不去擔(dān)心

30、u之間的可能到相關(guān)關(guān)系而對Y產(chǎn)生的影響。,,干擾u和解釋變量X之間是不相關(guān)的。如果X和u是相關(guān)的，例如X和u正相關(guān)，那么當(dāng)u增加的時(shí)候X也增加。類似的，如果X和u負(fù)相關(guān)，則當(dāng)u增加時(shí)X減少。我們將無法準(zhǔn)確地區(qū)分X和u各自對Y產(chǎn)生了什么樣的影響。,假定6：ui和Xi的協(xié)方差為零。用符號來表示：,對于前例，如果我們只有一組X和Y的觀測值，我們將無法從這一次觀測中去估計(jì)參數(shù) ，對于兩個參數(shù)估計(jì)，我們至少需要兩組數(shù)據(jù)。,

31、假定7：觀測次數(shù)n必須大于待估計(jì)的參數(shù)個數(shù)。,回到前面的公式中：如果全部的X值都相等，則Xi= ，那么上式中的分母就為零，從而我們無法估計(jì)β2，也就無法估計(jì)β1。要把回歸當(dāng)做一種工具來使用，Y和X兩者均有變化是前提，換句話說，變量必須在變。,假定8：X值要有變異性。在一個給定的樣本中，X值不可以完全是相同的。,如果模型中漏掉了一些重要的變量，或者選擇了錯誤的函數(shù)形式，或者對所含變量作出了錯誤的隨機(jī)假定，那么我們就要質(zhì)疑回歸

32、的有效性。,假定9：正確地設(shè)定了回歸模型。另外一個說法是，在經(jīng)驗(yàn)分析中所用的模型沒有設(shè)定偏誤。,這一假設(shè)，我們將在后續(xù)的學(xué)習(xí)中加以解釋它的重要性。,假定10：沒有完全的多重共線性。就是說，解釋變量之間沒有完全的線性關(guān)系。,3.3最小二乘估計(jì)的精度或標(biāo)準(zhǔn)誤差我們估算出來的的“可靠性”或者精密度如何呢？在統(tǒng)計(jì)學(xué)上一個估計(jì)量的精密度是由它的標(biāo)準(zhǔn)誤（se）來衡量的。var方差，se標(biāo)準(zhǔn)誤，δ2是假定4中的

33、ui的共同方差。,附方差的推導(dǎo),除了δ2以外，上述方程中的一切變量均可以從數(shù)據(jù)中估計(jì)出來，δ2由下面公式估算：是真正的但未知的δ2的OLS估計(jì)量，n-2被稱為自由度（df）的個數(shù)，則表示殘差平方的總和或者剩余平方和（RSS）。,注意的方差，有如下特點(diǎn)：的方差和δ2成正比，而與成反比。就是說，給定的δ2，X值變化越大，

34、方差越小，從而β2的估計(jì)精度越高。此外，隨樣本容量n的增加，中的項(xiàng)數(shù)將增加， β2的估計(jì)精度隨n的增加而增加。的方差與δ2和成正比，而與和樣本大小n成反比。最后，由于是估計(jì)量，對于給定的樣本，它們還可能是相互影響的。這種依賴性由它們之間的協(xié)方差來衡量。,3.5 判定系數(shù)r2：“擬合優(yōu)度”的一個度量如果所有的觀測點(diǎn)都落在樣本回歸線上，我們就

35、得到了一個“完美”的擬合。但是這種情況很少發(fā)生。一般的是情形下，總有一些正的和負(fù)的。我們所能希望的僅僅是圍繞著回歸線的殘差盡可能的小。判定系數(shù)r2（雙變量情形）和R2（多變量的情況）就是告訴人們這條樣本回歸線對數(shù)據(jù)的擬合程度有多么好的一個總度量。,r2稱為（樣本）判定系數(shù)，它是對回歸線擬合優(yōu)度的最為常用的一種度量。r2度量了在Y的總變異中，由回歸模型解釋的那部分所占的比例或百分比。r2的性質(zhì)：1.它是一個非負(fù)數(shù)。2

36、.它的界限為0≦ r2 ≦1。,r2的更簡便的求解公式,一個例子每周家庭消費(fèi)支出Y和每周家庭收入的調(diào)查數(shù)據(jù)--------------------------------------------------------------Y美元 X美元 Y美元 X美元 70 80 115

37、 180 65 110 120 200 90 120 140 220 95 140 155 240 110 160 150

38、 260--------------------------------------------------------------利用EViews 6.0 軟件計(jì)算結(jié)果如下：Dependent Variable: YMethod: Least SquaresDate: 08/18/11 Time: 16:27Sample: 1 10Includ

39、ed observations: 10=====================================================VariableCoefficientStd. Errort-StatisticProb. ===================================================== C24.454556.413817

40、3.8127910.0051 X0.5090910.03574314.243170.0000=====================================================R-squared 0.962062 Mean dependent var111.0000Adjusted R-squared 0.957319

41、60; S.D. dependent var31.42893S.E. of regression 6.493003 Akaike info criterion6.756184Sum squared resid 337.2727 Schwarz criterion6.816701Log

眾賞文庫> 全部分類> 畢業(yè)設(shè)計(jì)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 眾賞文庫僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

第1章雙變量回歸分析

文檔簡介

溫馨提示

最新文檔

評論

第1章 雙變量回歸分析

文檔簡介

溫馨提示

最新文檔

評論

免費(fèi)下載

第1章雙變量回歸分析