因子分析-湖北大學(xué)新聞傳播學(xué)院歡迎你!_第1頁
已閱讀1頁,還剩58頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、第五章 因子分析,第一節(jié) 因子分析簡介第二節(jié) 基本原理第三節(jié) 求解初始因子第四節(jié) 解釋因子第五節(jié) 因子值及其應(yīng)用第六節(jié) 研究實(shí)例,參見郭志剛主編,《社會統(tǒng)計分析方法—SPSS軟件應(yīng)用》第三章, 中國人民大學(xué)出版社1999,第一節(jié) 因子分析簡介,因子分析( Factor Analysis ,也稱因素分析)是一種數(shù)據(jù)化簡技術(shù)1、考察一組變量之間的協(xié)方差或相關(guān)系數(shù)結(jié)構(gòu)2、解釋這些變量與為數(shù)較少的因子(即不可觀測

2、的潛變量) 之間的關(guān)聯(lián),分類,探索性因子分析( Exploratory Factor Analysis ,EFA) 驗(yàn)證性因子分析(Confirmatory Factory Analysis ,CFA ) ——也稱為實(shí)證性因子分析、證實(shí)性因子分析、確定性因子分析) 。,共同點(diǎn),1、理論基礎(chǔ):普通因子分析模型2、主要目的:濃縮數(shù)據(jù) ——通過對諸多變量的相關(guān)性研究,用假想的少數(shù)幾個變量(因子、潛變量) 來表示原來

3、變量(觀測變量) 的主要信息。,不同,1、基本思想不同因子分析的基本思想是要尋找公共因子,以達(dá)到數(shù)據(jù)化簡的目的。探索性因子分析:找出影響觀測變量的因子個數(shù),以及各個因子和各個觀測變量之間的相關(guān)程度,以試圖揭示一套相對比較大的變量的內(nèi)在結(jié)構(gòu)。研究者的假定是每個指標(biāo)變量都與某個因子匹配,而且只能通過因子載荷憑知覺推斷數(shù)據(jù)的因子結(jié)構(gòu)。,驗(yàn)證性因子:決定事前定義因子的模型擬合實(shí)際數(shù)據(jù)的能力,以試圖檢驗(yàn)觀測變量的因子個數(shù)和因子載荷是否與基于

4、預(yù)先建立的理論的預(yù)期一致。指標(biāo)變量是基于先驗(yàn)理論選出的,而因子分析是用來看它們是否如預(yù)期的一樣。先驗(yàn)假設(shè):每個因子都與一個具體的指示變量子集對應(yīng),并且至少要求預(yù)先假設(shè)模型中因子的數(shù)目,但有時也預(yù)期哪些變量依賴哪個因子。,2、應(yīng)用前提不同探索性因子分析沒有先驗(yàn)信息,而驗(yàn)證性因子分析有先驗(yàn)信息。探索性因子分析是在事先不知道影響因子的基礎(chǔ)上,完全依據(jù)樣本數(shù)據(jù),利用統(tǒng)計軟件以一定的原則進(jìn)行因子分析,通過因子載荷憑知覺推斷數(shù)據(jù)的因子結(jié)構(gòu),

5、最后得出因子的過程。適合于在沒有理論支持的情況下對數(shù)據(jù)的試探性分析。這就需要用驗(yàn)證性因子分析來做進(jìn)一步檢驗(yàn),驗(yàn)證性因子分析基于預(yù)先建立的理論,要求事先假設(shè)因子結(jié)構(gòu),其先驗(yàn)假設(shè)是每個因子都與一個具體的指示變量子集對應(yīng),以檢驗(yàn)這種結(jié)構(gòu)是否與觀測數(shù)據(jù)一致。也就是在上述數(shù)學(xué)模型中,首先要根據(jù)先驗(yàn)信息判定公共因子數(shù)m ,同時還要根據(jù)實(shí)際情況將模型中某些參數(shù)設(shè)定為某一定值。這樣,驗(yàn)證性因子分析也就充分利用了先驗(yàn)信息,在已知因子的情況下檢驗(yàn)所

6、搜集的數(shù)據(jù)資料是否按事先預(yù)定的結(jié)構(gòu)方式產(chǎn)生作用。,3、理論假設(shè)不同探索性因子分析的假設(shè)主要包括: ①所有的公共因子都相關(guān)(或都不相關(guān)) ; ②所有的公共因子都直接影響所有的觀測變量; ③特殊(唯一性) 因子之間相互獨(dú)立; ④所有觀測變量只受一個特殊(唯一性) 因子的影響; ⑤公共因子與特殊因子(唯一性) 相互獨(dú)立。,驗(yàn)證性因子分析克服了探索性因子分析假設(shè)條件約束太強(qiáng)的缺陷,其假設(shè)主要包括: ①公共因子之間可以相關(guān),也可以無

7、關(guān); ②觀測變量可以只受一個或幾個公共因子的影響,而不必受所有公共因子的影響; ③特殊因子之間可以相關(guān),還可以出現(xiàn)不存在誤差因素的觀測變量; ④公共因子與特殊因子之間相互獨(dú)立,4、分析步驟不同探索性因子分析主要有以下七個步驟: ①收集觀測變量:通常采用抽樣的方法,按照實(shí)際情況收集觀測變量數(shù)據(jù)。②構(gòu)造相關(guān)矩陣:根據(jù)相關(guān)矩陣可以確定是否適合進(jìn)行因子分析。③確定因子個數(shù):可根據(jù)實(shí)際情況事先假定因子個數(shù),也可以按照特征根大于1 的

8、準(zhǔn)則或碎石準(zhǔn)則來確定因子個數(shù)。④提取因子:可以根據(jù)需要選擇合適的因子提取方法,如主成分方法、加權(quán)最小平方法、極大似然法等。,,⑤因子旋轉(zhuǎn):由于初始因子綜合性太強(qiáng),難以找出實(shí)際意義,因此一般都需要對因子進(jìn)行旋轉(zhuǎn)(常用的旋轉(zhuǎn)方法有正交旋轉(zhuǎn)、斜交旋轉(zhuǎn)等) ,以便于對因子結(jié)構(gòu)進(jìn)行合理解釋。⑥解釋因子結(jié)構(gòu):可以根據(jù)實(shí)際情況及負(fù)載大小對因子進(jìn)行具體解釋。⑦計算因子得分:可以利用公共因子來做進(jìn)一步的研究,如聚類分析、評價等。,驗(yàn)證性因子分析主要

9、有以下六個步驟: ①定義因子模型:包括選擇因子個數(shù)和定義因子載荷。因子載荷可以事先定為0 、或者其它自由變化的常數(shù),或者在一定的約束條件下變化的數(shù)(比如與另一載荷相等) 。②收集觀測值:根據(jù)研究目的收集觀測值。③獲得相關(guān)系數(shù)矩陣:根據(jù)原始資料數(shù)據(jù)獲得變量協(xié)方差陣。④擬合模型:這里需要選擇一種方法(如極大似然估計、漸進(jìn)分布自由估計等) 來估計自由變化的因子載荷。,⑤評價模型:當(dāng)因子模型能夠擬合數(shù)據(jù)時,因子載荷的選擇要使模型暗含的相

10、關(guān)矩陣與實(shí)際觀測矩陣之間的差異最小。常用的統(tǒng)計參數(shù)有:卡方擬合指數(shù)(χ2 ) 、比較擬合指數(shù)(CFI) 、擬合優(yōu)度指數(shù)( GFI) 和估計誤差均方根( RMSEA) 。根據(jù)Bentler(1990) 的建議標(biāo)準(zhǔn),χ2 ≤3. 0 、CFI ≥0. 90 、GFI ≥0. 85 、RMSE ≤0. 05 ,則表明該模型的擬合程度是可接受的。⑥修正模型:如果模型擬合效果不佳,應(yīng)根據(jù)理論分析修正或重新限定約束關(guān)系,對模型進(jìn)行修正,以得到最

11、優(yōu)模型。,5、主要應(yīng)用范圍不同探索性因子分析: ①尋求基本結(jié)構(gòu),解決多元統(tǒng)計分析中的變量間強(qiáng)相關(guān)問題;②數(shù)據(jù)化簡。,驗(yàn)證性因子分析允許研究者將觀察變量依據(jù)理論或先前假設(shè)構(gòu)成測量模式,然后評價此因子結(jié)構(gòu)和該理論界定的樣本資料間符合的程度。因此,主要應(yīng)用于以下三個方面: ①驗(yàn)證量表的維度或面向性( dimensionality) ,或者稱因子結(jié)構(gòu),決定最有效因子結(jié)構(gòu); ②驗(yàn)證因子的階層關(guān)系; ③評估量表的信度和效度。,,假設(shè)觀

12、測變量之間相關(guān)是因?yàn)樗麄児蚕砉蜃印?探索性因子分析思路,目的:化簡數(shù)據(jù)方式:研究眾多變量之間的內(nèi)部依賴關(guān)系,探求觀測數(shù)據(jù)中的基本結(jié)構(gòu),并用少數(shù)幾個假想變量(因子)表示基礎(chǔ)數(shù)據(jù)結(jié)構(gòu)實(shí)質(zhì):研究如何以最少的信息丟失把眾多觀測變量濃縮為少數(shù)幾個因子,將每個觀測變量用一組因子的線性組合表示:xi = ai1 f1 + ai2 f2 + …+ aim fm + ui ( i = 1,2,…,k)(1) f1 ,f2 ,…

13、,fm 叫做公因子(Common factors),它們是各個觀測變量所共有的因子,解釋了變量之間的相關(guān)。(2) ui稱為特殊因子(Unique factor),它是每個觀測變量所特有的因子,相當(dāng)于多元回歸中的殘差項,表示該變量不能被公因子所解釋的部分。(3) aij 稱為因子負(fù)載(Factor loadings),它是第i個變量在第j個公因子上的負(fù)載,相當(dāng)于多元回歸分析中的標(biāo)準(zhǔn)回歸系數(shù)(i=1,…,k; j=1,…,m)。,第

14、二節(jié) (探索性)因子分析原理,一、模型,因子分析模型,公因子個數(shù)小于等于觀測變量數(shù),1、因子負(fù)載 (factor loading) 反映了因子和變量之間的相關(guān)程度,當(dāng)公因子之間完全不相關(guān)時,等于變量和因子之間的相關(guān)系數(shù)。,二、概念,大多數(shù)情況下,人們往往假設(shè)公因子之間的關(guān)系是彼此正交的(orthogonal),即不相關(guān)——因子負(fù)載不僅表示了觀測變量如何由因子線性表示,而且反映了因子和變量間的相關(guān)程度,2、公因子方差(Co

15、mmunality) 又稱共同度、公共方差,指觀測變量方差中由公因子決定的比例。 當(dāng)公因子之間彼此正交時,公因子方差等于和該變量有關(guān)的因子負(fù)載的平方和,用公式表示為:hi2 = ai12 + ai22 + … + aim2 (行平均和),,變量方差=公因子方差+特殊因子方差,值越大,變量能被因子說明的程度越高意義:說明如果用公因子替代觀測變量后,原來每個變量的信息被保留的程度,3、因子貢獻(xiàn)(Contribution

16、s) 反映每個公因子對數(shù)據(jù)的解釋能力,用該因子所解釋的總方差來衡量。,,因子貢獻(xiàn):因子負(fù)載列平方和即:數(shù)據(jù)輸出中的特征值,更常用指標(biāo):每個因子所解釋的方差(因子貢獻(xiàn))占所有變量總方差的比例 (即:因子貢獻(xiàn)或特征值除以變量個數(shù)——即總方差,因?yàn)闃?biāo)準(zhǔn)化變量的標(biāo)準(zhǔn)差和方差均為1)衡量公因子的相對重要性,公因子累積解釋方差比例,判斷因子分析效果,1、檢查相關(guān)矩陣是否適合做因子分析(變量間應(yīng)高度相關(guān) >0.3)2、提取因子

17、3、因子旋轉(zhuǎn)4、計算因子值,三、因子分析的步驟,變量:間距測度及以上。樣本規(guī)模:至少是變量數(shù)的5倍,判斷數(shù)據(jù)是否適合做 因子分析,1、反映象相關(guān)矩陣 (Anti-image correlation matrix)。 其元素等于負(fù)的偏相關(guān)系數(shù)。2、巴特利特球體檢驗(yàn)(Bartlett test of sphericity) 零假設(shè)為相關(guān)矩陣是單位陣(說明變量間不相關(guān))3、KMO (Kaiser-Meyer-

18、Olkin Measure of Sampling Adequacy) 測度。 該測度從比較觀測變量之間的簡單相關(guān)系數(shù)和偏相關(guān)系數(shù)的相對大小出發(fā),【0,1】。當(dāng)所有變量之間的偏相關(guān)系數(shù)的平方和,遠(yuǎn)遠(yuǎn)小于簡單相關(guān)系數(shù)的平方和時,KMO值接近1. 0.9以上,非常好; 0.6,差; 0.8以上,好; 0.5,很差; 0.7,一般;

19、 0.5 以下,不能接受,該矩陣中各項值應(yīng)該比較小。因?yàn)檫@說明變量間存在大量的重疊影響(公因子),應(yīng)該通過檢驗(yàn),數(shù)(純)量矩陣(標(biāo)量矩陣),稱為單位矩陣(或單位陣).有時也記作E.,為數(shù)量矩陣或標(biāo)量陣。,當(dāng) 時,記作,,,,,,第三節(jié) 求解初始因子,目的:確定能夠解釋觀測變量之間相關(guān)關(guān)系的最小因子個數(shù)主成分分析:獨(dú)立的數(shù)據(jù)化簡技術(shù)。因子分析將其結(jié)果作為初始因子解(特征值)公因

20、子分析:主軸因子法、極大似然法、最小二乘法、alpha法,一、主成分分析法,把給定的一組(k個)相關(guān)變量通過線性變換轉(zhuǎn)換成另一組不相關(guān)的變量,這些新的變量按照方差依次遞減的順序排列。轉(zhuǎn)換中保持變量的總方差不變,使第一個變量具有最大的方差,稱為第一主成分,第二個變量方差次大,且和第一個變量不相關(guān),稱為第二主成分,依次類推,k個變量有k個主成分,1、主成分的幾何意義,最長的軸:第一主成分次長的軸:第二主成分……,2、主成分的求解,數(shù)

21、學(xué)工具:特征方程做法:通過求解觀測變量相關(guān)矩陣的特征方程,得到k個特征值和對應(yīng)的k個單位特征向量,把k個特征值從大到小排列,它們分別代表k個主成分所解釋的觀測變量的方差主成分是觀測變量的線性組合,線性組合的權(quán)數(shù)即為相應(yīng)的單位特征向量中的元素,1)特征值準(zhǔn)則:保留特征值大于等于1的因子2)碎石檢驗(yàn)準(zhǔn)則(SCREE TEST CRITERION)——因子特征值隨因子個數(shù)變化的散點(diǎn)圖曲線變平開始的前一點(diǎn)被認(rèn)為是提取的最大因子數(shù)

22、因子累計解釋方差的比例超過70-80%。3)直接指定因子個數(shù)。,3、確定因子個數(shù),二、公因子分析法,從解釋變量的方差出發(fā),假設(shè)變量的方差能完全被主成分所解釋,從解釋變量之間的相關(guān)關(guān)系出發(fā),假設(shè)觀測變量之間的相關(guān)能完全被公因子解釋但變量的方差不一定完全被公因子解釋,這樣每個變量被公因子所解釋的方差不再是1,而是公因子方差求解因子解時,只考慮公因子方差,,主成分法,公因子法,公因子方差的估計主軸因子法最小二乘法最大似然法a因

23、子提取法映象分析法,,,方法選擇,依據(jù):目的+對變量方差的了解程度——以最少的因子最大程度地解釋原始數(shù)據(jù)中的方差 / 知道特殊因子和誤差帶來的方差很小 主成分分析法——為了確定數(shù)據(jù)結(jié)構(gòu),而且并不了解變量方差 公因子分析法,,,,解很接近,第四節(jié) 解釋因子,求得因子解后,大多數(shù)因子都和很多變量有關(guān),無法很好地說明其實(shí)際含義,,一、思路,因子旋轉(zhuǎn)的目的: 通過改變坐標(biāo)軸的位置,重新分配各個因子所解釋的方差的比例,使因子

24、結(jié)構(gòu)更簡單,更易于解釋。 因子旋轉(zhuǎn)不改變模型對數(shù)據(jù)的擬合程度,不改變每個變量的公因子方差,因子旋轉(zhuǎn)方法 Rotation,正交旋轉(zhuǎn)(Orthogonal Rotation): 因子軸之間仍然保持90度角,即因子之間是不相關(guān)的。斜交旋轉(zhuǎn)(Oblique Rotation): 因子軸之間不必是90度角,即因子之間可以是相關(guān)的。,,四次方最大法-QUARTIMAX

25、 方差最大法-VARIMAX 等量最大法-EQUIMAX,二、正交旋轉(zhuǎn)方法,目標(biāo):簡化因子負(fù)載矩陣的行和列,使因子負(fù)載向0,1兩極分化,,因子模式和因子結(jié)構(gòu)因子模式(Factor pattern)矩陣:因子負(fù)載矩陣因子結(jié)構(gòu)(Factor structure)矩陣:因子和變量之間的相關(guān)矩陣。 在斜交旋轉(zhuǎn)中,因子負(fù)載不

26、再等于因子和變量之間的相關(guān)系數(shù),因子結(jié)構(gòu)和因子模式之間是有區(qū)別的。二者關(guān)系: S = BWS 因子結(jié)構(gòu)矩陣B 因子模式矩陣W 斜交因子之間的相關(guān)系數(shù)矩陣斜交因子解,三、斜交旋轉(zhuǎn)方法,數(shù)據(jù)化簡,把很多變量濃縮成少數(shù)幾個因子,對因子的確切含義不在意——正交旋轉(zhuǎn)得到理論上有意義的因子——斜交,四、選擇旋轉(zhuǎn)方法,理論上斜交優(yōu)于正交但實(shí)際上正交應(yīng)用更為廣泛默認(rèn):方差最大法,做法:從簡化因子負(fù)載矩

27、陣的每列出發(fā),使和每個因子有關(guān)的負(fù)載平方的方差最大意義:希望通過因子旋轉(zhuǎn)后,使每個因子上的負(fù)載盡可能地拉開距離,趨于0或1,得到最后因子解后,我們希望給每個因子一個有意義的解釋。解釋因子主要是借助于因子負(fù)載矩陣,首先找出在每個因子上有顯著負(fù)載的變量,根據(jù)這些變量的意義給因子一個合適的名稱,具有較高負(fù)載的變量對因子名稱的影響更大。實(shí)際中,一般認(rèn)為絕對值大于0.3 的因子負(fù)載就是顯著的。,四、解釋因子,因子值(Factor sc

28、ores): 因子在每個樣本案例上的值。,xji是第j個變量在第i個案例上的值,wpj是第p個因子和第j個變量之間的因子值系數(shù),第五節(jié) 因子值及其應(yīng)用,有了因子值,就可以把因子作為變量來用,進(jìn)行其他的統(tǒng)計分析,,,理解,因子分析模型是用因子的線性組合來表示一個觀測變量,因子負(fù)載是該線性組合的權(quán)數(shù)(標(biāo)準(zhǔn)化回歸系數(shù))求因子值的過程正好相反,它通過觀測變量的線性組合來表示因子,因子值是觀測變量的加權(quán)平均。因?yàn)楦鱾€變量在因

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論