版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、第一章 雙變量回歸分析,教師:盧時(shí)光,1. 回歸分析的性質(zhì),F.加爾頓(Francis Galton)發(fā)現(xiàn),雖然有一個趨勢:父母高,兒女也高;父母矮,兒女也矮,但給定父母的身高,兒女輩的平均身高卻趨向于或者“回歸”到全體人口的平均身高。K.皮爾遜(Karl Pearson)證實(shí)了加爾頓普遍回歸定律。皮爾遜收集了1000多個家庭的身高記錄。他發(fā)現(xiàn)對于父輩高的群體,兒輩的平均身高低于他們的父輩,而對于父輩矮的群體,兒輩的平均身高則高于他們
2、的父輩。用加爾頓的話來說,就是“回歸到中等(regression to mediocrity)”。,1.2 回歸的現(xiàn)代定義回歸分析是關(guān)于研究一個應(yīng)變量對另一個解釋變量的依賴關(guān)系,其用意在于通過后者(在重復(fù)抽樣中)的已知或設(shè)定值,去估計(jì)和(或)預(yù)測前者的(總體)均值?;氐郊訝栴D的例子:我們關(guān)心給定父輩身高,找出兒輩平均身高的變化。值得注意的是,隨著父輩身高的增加,兒輩平均身高也在增加。,如左圖所示:注意對應(yīng)任一給定的父輩的身高,都有
3、一個兒輩身高的分布范圍。我們勾畫了一條通過這些散點(diǎn)的一條直線,以表示兒輩平均身高如何隨父輩身高的增加而增加的。這條線我們稱為回歸線(regression line)。,1.3 統(tǒng)計(jì)關(guān)系和確定性關(guān)系如上例中,我們不像經(jīng)典物理學(xué)中考慮的那種變量之間的函數(shù)或確定性依賴關(guān)系。在回歸分析中,我們考慮的是一類所謂統(tǒng)計(jì)依賴關(guān)系。在變量之間的統(tǒng)計(jì)關(guān)系中,我們主要處理是隨機(jī)變量,也就是有著概率分布的變量。例如,作物收成對氣溫、降水、陽光及施肥的依賴關(guān)
4、系是統(tǒng)計(jì)性質(zhì)的。這個性質(zhì)的意義在于:這些解釋變量固然重要,但是并不能夠使農(nóng)業(yè)學(xué)家準(zhǔn)確地預(yù)測作物的收成。一則這些變量的測量是有誤差的,二則還有一大堆影響到作物收成的變量,我們無法一一識別出來。,1.4 回歸和因果關(guān)系雖然回歸分析是研究一個變量對另一些變量的依賴關(guān)系,但它并不一定意味著因果關(guān)系。用肯達(dá)爾和斯圖亞特的話說:“一個統(tǒng)計(jì)關(guān)系式,無論多強(qiáng)也不管多么有啟發(fā)性,卻永遠(yuǎn)不能確立因果方面的聯(lián)系,對因果關(guān)系的理念,必須來自統(tǒng)計(jì)學(xué)以外,最終來
5、自這種或那種理論?!崩缭谥T多有趣的經(jīng)濟(jì)指標(biāo)中有一個“裙子長短指數(shù)”。這個指數(shù)用女性穿著裙子的長短來判斷經(jīng)濟(jì)的好壞。當(dāng)經(jīng)濟(jì)不好時(shí),失業(yè)率增加,女性就業(yè)更困難,短裙看起來能年輕、活力一些,有利于尋求新的職位。但是我們不能因此得到結(jié)論:在座的女生穿著短裙是因?yàn)榻?jīng)濟(jì)不好,或者因?yàn)樵谧呐┲倘顾灾袊慕?jīng)濟(jì)不好。從邏輯上說,統(tǒng)計(jì)關(guān)系式本身不意味著任何因果關(guān)系。,1.5 數(shù)據(jù)的性質(zhì)用于經(jīng)濟(jì)分析的數(shù)據(jù)有三類:時(shí)間序列、橫截面數(shù)據(jù)、和混合
6、數(shù)據(jù)。時(shí)間序列:對一個變量在不同時(shí)期取值的一組觀測結(jié)果。例如隨著年份GDP的變換、上證綜合指數(shù)的每日變換等等?;跁r(shí)間序列數(shù)據(jù)的計(jì)量分析,大多假定所依據(jù)的時(shí)間序列數(shù)據(jù)是平穩(wěn)的(stationary)。粗略地來說,如果一組時(shí)間序列數(shù)據(jù),它們的均值和方差在時(shí)間上沒有系統(tǒng)的變化,就是平穩(wěn)的。要記?。好慨?dāng)你使用時(shí)間序列數(shù)據(jù)時(shí),你都要問一問它的平穩(wěn)性如何。,橫截面數(shù)據(jù):對一個或多個變量在同一個時(shí)點(diǎn)上收集的數(shù)據(jù)。例如2012年9月份,全國主要3
7、0個省份的生豬的產(chǎn)量和價(jià)格、全國每個高校2012屆大學(xué)生的就業(yè)率等等。橫截面數(shù)據(jù)也有其自身的問題,特別是異方差(heterogeneity)的問題。有的?。ê稀⒔鳎┥a(chǎn)巨量的生豬,而有的?。ū本┖蛷V東)生產(chǎn)量很少。當(dāng)我們的統(tǒng)計(jì)分析中包含有相異的單元時(shí),我們必須考慮尺度效應(yīng),以避免把蘋果和桔子混同了起來。混合數(shù)據(jù):兼有時(shí)間序列和橫截面數(shù)據(jù)。例如人口普查數(shù)據(jù),從1980到2012年中國人口總量變化是時(shí)間序列,而2012年不同省市人口
8、的分布則是橫截面數(shù)據(jù)。,2. 雙變量回歸分析,2.1 一個例子假定一個國家人口總體由60戶家庭組成,X表示家庭周可支配收入,Y表示家庭周消費(fèi)支出。,將這60戶按照收入劃分為10組,分析每一組的家庭消費(fèi)支出。對應(yīng)每周收入在80美元的5戶,每周家庭消費(fèi)支出在55到75美元不等。上表中,每一縱列給出的是在給定的收入水平X下的消費(fèi)支出Y的分布。就是說,它給出了以X為給定值條件下的Y的條件分布。散點(diǎn)圖根據(jù)表格的數(shù)據(jù)制成。,現(xiàn)在,對于給定的X,
9、例如X=80美元,有5個Y值:55、60、65、70和75美元。因此給定X=80得到這些消費(fèi)支出中任何一個概率是1/5。用符號來表示:對于Y的每一條件概率分布,我們能夠計(jì)算出來它的均值,稱為條件均值或條件期望,記做E(Y|X=Xi),并讀作“在X取特定Xi值時(shí)Y的期望值”。給定X=80,Y的期望或條件均值為:,回到散點(diǎn)圖中,我們更清楚的發(fā)現(xiàn),雖然,每個家庭的消費(fèi)支出都不相同,但隨著收入的增加,消費(fèi)水平平均地說也在增加。觀測紅色的
10、粗圓點(diǎn)代表的Y的各個條件均值,這種察覺就更加的直觀和形象。散點(diǎn)圖表明,這些條件均值都落在一個有正斜率的直線上。這個直線叫做總體回歸線。更簡單地說,它是Y對X的回歸。,在幾何意義上,總體回歸線就是當(dāng)解釋變量取給定值時(shí),應(yīng)變量的條件均和或期望的軌跡。,2.2總回歸函數(shù)(PRF)從前面的討論中,我們清楚地看到,每一條件均值E(Y|Xi)都是Xi的一個函數(shù),用符號來表示:其中,f(Xi)表示解釋變量Xi的某個函數(shù)(在上例中, E(Y|Xi
11、) 是Xi的一個線性函數(shù)),我們把 稱為總體回歸函數(shù)(PRF)或簡稱為總體回歸(PR)。它說明在給定的Xi下,Y的分布均值與Xi有函數(shù)關(guān)系,或者,它表明了Y的均值是怎樣隨X而變化的。PRF的函數(shù)形式是一個經(jīng)驗(yàn)方面的問題,例如,經(jīng)濟(jì)學(xué)家會提出消費(fèi)和收入有線性關(guān)系,這樣PRF常常被寫作其中β1β2為不知的參數(shù),稱為回歸系數(shù),也分別被稱為截距和斜率系數(shù)。,2.3 線性的含義對線性的第一種解釋是,Y的條
12、件期望是Xi的線性函數(shù),從幾何意義上來看,這時(shí)回歸曲線是一條直線。按照這種解釋,諸如E(Y|Xi)= β1+β2+Xi2回歸函數(shù),變量X以指數(shù)2出現(xiàn),就不是線性的。對線性的第二種解釋是,Y的條件期望E(Y|Xi)是諸參數(shù)β的一個線性函數(shù),它可以是也可以不是X的線性函數(shù)。這樣E(Y|Xi)= β1+β2Xi2就算一個線性模型,而E(Y|Xi)= β1+β22Xi2則不是。在我們這里,我們認(rèn)為“線性”是對參數(shù)為線性的情形,因此,從現(xiàn)在開
13、始“線性”一詞總是指對參數(shù)β為線性的一種回歸(即參數(shù)總是以它的1次方出現(xiàn));對解釋變量X則可以是或不是線性的。 E(Y|Xi)= β1+β2Xi和E(Y|Xi)= β1+β2Xi2都是線性回歸模型(LRM)。,2.4 總回歸方程的隨機(jī)設(shè)定前面的例子中,隨著家庭收入的增加,家庭消費(fèi)支出平均的也增加。但是對個單獨(dú)某個家庭來說,消費(fèi)支出水平卻不一定隨收入水平增加而增加。例如,對應(yīng)于每周100美元的收入水平,有一家庭的消費(fèi)支出是65美元,而對
14、應(yīng)于收入80美元的兩戶家庭,消費(fèi)支出為70和75美元。那么,在個別家庭的消費(fèi)支出與給定的收入水平之間存在什么關(guān)系呢?我們在前面的分析中看到,給定收入水平Xi的個別家庭的消費(fèi)支出圍繞在收入為Xi的所有家庭的平均消費(fèi)支出的周圍,也就是圍繞在它的條件均值。因此我們可以把個別家庭的Yi圍繞在它的期望值的離差(deviation)表述如下:,ui被稱為隨機(jī)干擾或隨機(jī)誤差項(xiàng)。給定X水平,個別家庭的支出可以表示為兩個成分之和(1) E(Y|Xi)
15、代表相同收入水平的所有家庭的平均消費(fèi)支出,這個成分被稱為系統(tǒng)性或確定性成分,以及(2) ui被稱為隨機(jī)的或非系統(tǒng)性的成分。也可以理解為ui是所有影響Y的,但是沒能包含到回歸方程中的,被忽略變量的替代變量。方程: 表示一個家庭的消費(fèi)支出,線性地依賴于它收入加上干擾項(xiàng)。給定X=80,各個家庭的消費(fèi)支出表達(dá)為:,回到剛才的式子:現(xiàn)在,如果兩邊取期望,則:式中, E(Y|Xi)是條件期望,是一個常數(shù),故E[E(Y|Xi)
16、]就是它自身。而E(Yi|Xi)就是E(Y|Xi),故:因此,假定回歸線從Y的條件均值通過,就意味著,ui的(以給定的Xi為條件的)條件均值為零。,2.5 隨機(jī)干擾項(xiàng)的意義干擾項(xiàng)是從模型中沒有包含的而又集體地影響著Y的全部變量的替代物。為什么我們不構(gòu)造一個包含盡可能多的變量的復(fù)回歸模型?理由如下:1.理論的含糊性;2.數(shù)據(jù)的欠缺;3.核心變量和周邊變量;4.人類行為的內(nèi)在隨機(jī)性;5.“不好的”替代變量;6.節(jié)省的原則
17、;7.錯誤的函數(shù)形式。為了所有上述理由,我們在隨后的學(xué)習(xí)中會發(fā)現(xiàn),隨機(jī)干擾項(xiàng)在回歸分析中扮演了極其重要的角色。,2.6 樣本回歸函數(shù)(SRF)注意我們前面的例子中,我們假定一個國家是由60戶家庭組成的,故我們得到的是一個關(guān)于這60戶家庭收入和消費(fèi)支出的完整的總體數(shù)據(jù)。在大多數(shù)實(shí)際情況下,我們僅有對應(yīng)于某些固定的X的Y值的樣本,這樣我們就必須面對抽樣問題,例如有下列兩組抽樣數(shù)據(jù):,問題:我們能夠從抽樣數(shù)據(jù)中預(yù)測整個總體中對應(yīng)于給定
18、的X的平均每周消費(fèi)支出Y嗎?將表中的數(shù)據(jù)描繪為散點(diǎn)圖:,在散點(diǎn)圖中,我們畫了兩根樣本回歸線以盡量好的擬合這些散點(diǎn)。SRF1是根據(jù)第一個樣本的數(shù)據(jù),而SRF2是根據(jù)第二個樣本的數(shù)據(jù)。那么,兩條回歸線中那一條代表“真實(shí)”的總體樣本回歸線?事實(shí)上,我們不可能有絕對把握知道哪一條代表了真實(shí)的總體回歸線。因?yàn)槌闃拥牟▌?,它們最多也不過是真實(shí)總體回歸線的一個逼近而已。一般的來說,從N個不同樣本中會得到N個不同的樣本回歸函數(shù),并且這些樣本回歸函數(shù)
19、不大會一樣。類比總體回歸函數(shù),我們能夠?qū)懗鲆粋€代表樣本回歸線的樣本回歸函數(shù)(SRF):這里 分別是Y,β1和β2的估計(jì)量。,我們還能把SRF表達(dá)為它的隨機(jī)形式:其中,除了定義過的符號外, 表示樣本殘差項(xiàng)。概念上, 類似于ui,并且可把它當(dāng)做是ui的估計(jì)量,把它引入到SRF中的理由和把ui引入PRF中來,是出于同一個理由。至此,總的來說,回歸分析僅僅是依據(jù)某總體的一個樣本的時(shí)候比不是這樣的
20、時(shí)候多。我們的主要目的是根據(jù)樣本回歸函數(shù)(SRF):來估計(jì)總體樣本函數(shù)(PRF):,對于X=Xi,我們有一個觀測值Y=Yi。我們可以根據(jù)SRF將所觀測的Yi表達(dá)為:也可以根據(jù)PRF,表達(dá)為:現(xiàn)在,對于圖中所示的Xi, 明顯過高的估計(jì)了那里的真實(shí)的E(Y|Xi),類似的對于A點(diǎn)左側(cè),SRF低估了真實(shí)的PRF,而右側(cè)則恰好相反。,現(xiàn)在,重要的問題:既然認(rèn)識到了樣本回歸函數(shù)不過是總體回歸函數(shù)的一個近似,能不能設(shè)計(jì)一種規(guī)則或方
21、法,使得這種近似是一種盡可能“接近”的近似?盡管真實(shí)的總體回歸函數(shù)永遠(yuǎn)不得而知。,3. 雙變量回歸模型:估計(jì)問題,3.1 普通最小二乘法原理回顧雙變量總體回歸函數(shù)(PRF):這個PRF不是直接可以觀測的。我們通過樣本回歸函數(shù)(SRF)去估計(jì)它:這里, 是Y的估計(jì)值(條件均值)。,我們把式子改寫為:這樣殘差 不過是實(shí)際Y值與估計(jì)值 之間的差。對于給定的Y和X,我們希望樣本回歸函數(shù)(SRF)能夠盡
22、可能的接近實(shí)際的Y,這樣我們采用如下原則:選擇這樣的SRF,使得盡可能的小。,上述標(biāo)準(zhǔn)似乎很給力,但卻存在缺陷。因?yàn)樵诳偤停褐校?得到的權(quán)重和 一樣多,而顯然后兩者離樣本回歸線距離要遠(yuǎn)得多。這樣可能所有的 都散布的很遠(yuǎn),但是 代數(shù)和卻很?。ㄉ踔翞榱悖?。為了避免這樣的問題,最小二乘準(zhǔn)則要給出樣本回歸函數(shù)(SRF),使得:盡可能小,其中 是殘差平方和。我們即將看到,
23、它得出來的估計(jì)量有很好的統(tǒng)計(jì)性質(zhì)。很明顯,殘差平方和是關(guān)于估計(jì)量 的某個函數(shù):,的最小二乘估計(jì)其中,n是樣本大小。這組聯(lián)立方程被稱為正則方程。,解上述方程組:,最小二乘(OLS)估計(jì)量的性質(zhì)OLS估計(jì)量是純粹由可觀測值(樣本值)表達(dá)的,因此這些量是容易計(jì)算的;這些量是點(diǎn)估計(jì)量,對于給定的樣本,每一估計(jì)量僅提供有關(guān)總體參數(shù)的一個值;從樣本數(shù)據(jù)得到OLS估計(jì)值,很容易畫出樣本回歸線,這樣得到的樣本
24、回歸線有如下性質(zhì)(不證明):1.它通過X和Y的樣本均值;2.估計(jì)的Y均值等于實(shí)測的Y的均值;3.殘差 的均值為零;4.殘差 和預(yù)測的Yi值不相關(guān);5.殘差 和Xi值不相關(guān)。,3.2經(jīng)典線性回歸模型:最小二乘模型的基本假定如果我們的目的僅僅是估計(jì) ,那么上節(jié)討論的OLS就足夠了。事實(shí)上,我們不僅僅是要估算出 的值,而且要對真實(shí)的 推斷,我們想知道 離它的真期
25、望值 有多近。為此,我們要對Yi的產(chǎn)生方式作出某些假設(shè)。而 表明,Yi是依賴于Xi和ui。因此除非我們明確Xi和ui是怎樣產(chǎn)生的,我們將無法對Yi作出任何統(tǒng)計(jì)推斷,也就無法對 作出統(tǒng)計(jì)推斷。就是說,為了回歸估計(jì)的有效解釋,我們對變量Xi和誤差項(xiàng)ui作出假定是極其重要的。,我們在前面探討過線性的定義,在我們這里我們將始終堅(jiān)持這一定義。,假定1:線性回歸模
26、型?;貧w模型對參數(shù)而言是線性的。,我們關(guān)于總體樣本函數(shù)(PRF)的討論中,隱含著這樣一個假定“重復(fù)抽樣中的固定值”。對它的理解很重要。回到我們最初的例子上:我們假定一個由60戶家庭組成,我們統(tǒng)計(jì)了這60戶家庭的收入X和家庭消費(fèi)支出Y的數(shù)據(jù)。這樣我們把收入值固定在80美元/周,隨機(jī)的抽取一個家庭,并觀測它的周家庭消費(fèi)支出,例如說60美元;接著我們?nèi)匀话咽杖隭固定在80美元/周,再隨機(jī)的抽取令一個家庭,觀測它的周家庭消費(fèi)支出為75美元。在每
27、次抽?。ㄖ貜?fù)抽樣)中,我們都把X值固定在80美元上,直到所有周收入為80美元的家庭統(tǒng)計(jì)完畢。事實(shí)上我們例子中的數(shù)據(jù)就是這樣產(chǎn)生的。所有的這些意味著,我們的回歸分析是條件回歸分析,就是以X給定值為條件的。,假定2:在重復(fù)抽樣中X值是固定的。,假定3:干擾項(xiàng)ui的均值為零。對于給定的X值,ui的條件期望(均值)為零,用公式來表達(dá):,其實(shí),這個假定無非是告訴我們,凡是模型中沒有包含的,沒有被作為解釋變量的其他而被歸結(jié)為ui的因素,都不應(yīng)該對
28、Y的均值產(chǎn)生系統(tǒng)性的影響?;蛘哒f,正的ui和負(fù)的ui相互抵消了,以至于它們對Y的平均影響為零。,對于每個ui的方差,都是某個等于δ2的正常數(shù)。意味著,對應(yīng)于不同的X值的Y總體均有相同的方差。圖3.4和3.5都表明了隨收入增加,平均消費(fèi)水平增加。3.4中消費(fèi)支出方差在所有的收入水平下保持不變,而3.5則變大。當(dāng)X=X1時(shí),消費(fèi)水平平均地離PRF更近,而X=X3時(shí),消費(fèi)水平圍繞PRF分布更遠(yuǎn),顯然X=X1時(shí)的數(shù)據(jù)Y對我們來說更可靠一些。
29、,假定4:同方差性或ui的方差相等。對于給定的X值,對所有的觀測,ui的方差是恒定的。用公式來表達(dá):,假定5:各個干擾項(xiàng)之間無自相關(guān)。給定任意兩個X值:Xi和Xj(i≠j),ui和uj之間的相關(guān)為零。用符號來表示:,用專業(yè)的術(shù)語來說,就是無序列相關(guān)或無自相關(guān)。如果上述假定不成立,ut和ut-1存在相關(guān)關(guān)系,那么Yt不僅僅取決Xt而且還取決于ut,因?yàn)閡t-1在一定程度上決定了ut。我們利用假定5,就是只考慮Xt對Yt的影響,而不去擔(dān)心
30、u之間的可能到相關(guān)關(guān)系而對Y產(chǎn)生的影響。,,干擾u和解釋變量X之間是不相關(guān)的。如果X和u是相關(guān)的,例如X和u正相關(guān),那么當(dāng)u增加的時(shí)候X也增加。類似的,如果X和u負(fù)相關(guān),則當(dāng)u增加時(shí)X減少。我們將無法準(zhǔn)確地區(qū)分X和u各自對Y產(chǎn)生了什么樣的影響。,假定6:ui和Xi的協(xié)方差為零。用符號來表示:,對于前例,如果我們只有一組X和Y的觀測值,我們將無法從這一次觀測中去估計(jì)參數(shù) ,對于兩個參數(shù)估計(jì),我們至少需要兩組數(shù)據(jù)。,
31、假定7:觀測次數(shù)n必須大于待估計(jì)的參數(shù)個數(shù)。,回到前面的公式中:如果全部的X值都相等,則Xi= ,那么上式中的分母就為零,從而我們無法估計(jì)β2,也就無法估計(jì)β1。要把回歸當(dāng)做一種工具來使用,Y和X兩者均有變化是前提,換句話說,變量必須在變。,假定8:X值要有變異性。在一個給定的樣本中,X值不可以完全是相同的。,如果模型中漏掉了一些重要的變量,或者選擇了錯誤的函數(shù)形式,或者對所含變量作出了錯誤的隨機(jī)假定,那么我們就要質(zhì)疑回歸
32、的有效性。,假定9:正確地設(shè)定了回歸模型。另外一個說法是,在經(jīng)驗(yàn)分析中所用的模型沒有設(shè)定偏誤。,這一假設(shè),我們將在后續(xù)的學(xué)習(xí)中加以解釋它的重要性。,假定10:沒有完全的多重共線性。就是說,解釋變量之間沒有完全的線性關(guān)系。,3.3最小二乘估計(jì)的精度或標(biāo)準(zhǔn)誤差我們估算出來的 的“可靠性”或者精密度如何呢?在統(tǒng)計(jì)學(xué)上一個估計(jì)量的精密度是由它的標(biāo)準(zhǔn)誤(se)來衡量的。var方差,se標(biāo)準(zhǔn)誤,δ2是假定4中的
33、ui的共同方差。,附 方差的推導(dǎo),除了δ2以外,上述方程中的一切變量均可以從數(shù)據(jù)中估計(jì)出來,δ2由下面公式估算: 是真正的但未知的δ2的OLS估計(jì)量,n-2被稱為自由度(df)的個數(shù), 則表示殘差平方的總和或者剩余平方和(RSS)。,注意 的方差,有如下特點(diǎn): 的方差和δ2成正比,而與 成反比。就是說,給定的δ2,X值變化越大,
34、方差越小,從而β2的估計(jì)精度越高。此外,隨樣本容量n的增加, 中的項(xiàng)數(shù)將增加, β2的估計(jì)精度隨n的增加而增加。 的方差與δ2和 成正比,而與 和樣本大小n成反比。最后,由于 是估計(jì)量,對于給定的樣本,它們還可能是相互影響的。這種依賴性由它們之間的協(xié)方差來衡量。,3.5 判定系數(shù)r2:“擬合優(yōu)度”的一個度量如果所有的觀測點(diǎn)都落在樣本回歸線上,我們就
35、得到了一個“完美”的擬合。但是這種情況很少發(fā)生。一般的是情形下,總有一些正的 和負(fù)的 。我們所能希望的僅僅是圍繞著回歸線的殘差盡可能的小。判定系數(shù)r2(雙變量情形)和R2(多變量的情況)就是告訴人們這條樣本回歸線對數(shù)據(jù)的擬合程度有多么好的一個總度量。,r2稱為(樣本)判定系數(shù),它是對回歸線擬合優(yōu)度的最為常用的一種度量。r2度量了在Y的總變異中,由回歸模型解釋的那部分所占的比例或百分比。r2的性質(zhì):1.它是一個非負(fù)數(shù)。2
36、.它的界限為0≦ r2 ≦1。,r2的更簡便的求解公式,一個例子每周家庭消費(fèi)支出Y和每周家庭收入的調(diào)查數(shù)據(jù)--------------------------------------------------------------Y美元 X美元 Y美元 X美元 70 80 115
37、 180 65 110 120 200 90 120 140 220 95 140 155 240 110 160 150
38、 260--------------------------------------------------------------利用EViews 6.0 軟件計(jì)算結(jié)果如下:Dependent Variable: YMethod: Least SquaresDate: 08/18/11 Time: 16:27Sample: 1 10Includ
39、ed observations: 10=====================================================VariableCoefficientStd. Errort-StatisticProb. ===================================================== C24.454556.413817
40、3.8127910.0051 X0.5090910.03574314.243170.0000=====================================================R-squared 0.962062 Mean dependent var111.0000Adjusted R-squared 0.957319
41、60; S.D. dependent var31.42893S.E. of regression 6.493003 Akaike info criterion6.756184Sum squared resid 337.2727 Schwarz criterion6.816701Log
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 雙變量回歸模型
- gee多應(yīng)變量回歸分析
- 第二章雙變量線性回歸分析
- 工具變量回歸模型中的變量選擇.pdf
- 工具變量回歸中的估計(jì)問題.pdf
- 第9章 回歸分析
- 工業(yè)過程數(shù)據(jù)隱變量回歸建模及應(yīng)用.pdf
- 第5章自變量的選擇與逐步回歸
- 回歸分析第1章課后習(xí)題參考答案
- 第1章 隨機(jī)變量
- 銷售利潤與銷量回歸分析
- 第08章 相關(guān)分析與回歸分析(新)
- 應(yīng)用回歸分析第章詳細(xì)答案
- 支持向量回歸的算法分析.pdf
- 29269.基于環(huán)境協(xié)變量回歸模型的數(shù)字土壤制圖研究
- 指示變量回歸協(xié)方差分析及其在醫(yī)學(xué)研究中的應(yīng)用初探.pdf
- 應(yīng)用回歸分析課后習(xí)題第4章第13題
- 統(tǒng)計(jì)學(xué)a第9章--相關(guān)與回歸分析
- 第6章 相關(guān)與回歸分析習(xí)題解答
- 變量有誤差時(shí)線性回歸分析.pdf
評論
0/150
提交評論