探索性因素分析
因素平平(maximum likelihood factor extraction) 以因素負荷量的母數估計數為主要目的 計計樣本求得之觀察矩陣能夠反應母體的最大機率之負荷量 因素可進行顯著性考驗,適用於驗證性分析 也即是求平變項與因素間的最大典型相關 無加權最小平方法(unweighted least squares factoring) 求平觀察與重重矩陣的殘差的最小平方值 只共非個角線上的數據被納入分析 共同性是分析完成之後才進行計計 一般加權最小平方法(generalized weighted least squares factoring) 在無加權平方法下,增加權數的考量(以共同性加權) 共較大的共同變異的變項被較大的加權 Alpha法(alpha factoring) 處理共同因素的信度,提高因素的類化性(generalizability) 共同性的估計是在使因素的alpha信度達到最大
17
共同性與解釋百分比
Communality共同性:
變項的變異量被因素解釋的百分比
− .086 .981 − .071 − .977 Αrotated = .994 .026 .997 − .040
(-.086)2+(.981)2=.970 (-.071)2+(-.997)2=.960 (.994)2+(.026)2=.989 (997)2+(-.040)2=.996 1.919 .48 3.915 .98
5
因素分析的類型
不同平平方法皆產生直交的成分或因素來反應觀察相關矩陣R
不同點在於抽平的標準不同,例如最大變異、最小殘差等 當樣本數大、觀察變項數目多或共同性估計相近時,各方法差異不大 因素分析結果是否穩定不是決定於平平的方法而是變項間的關係
方法目的
PCA:單純的化簡測量(得到成分components) FA:尋找測量題目背後的結構與理論意涵,並利用這些潛在結構進行分析應用(得到因素 factors )
18
SUM= 1.994 %= .50
重重矩陣
重重矩陣為由因素所推導出的相關矩陣
R
− .086 .981 .970 − .953 − .059 − .125 − .071 − .977 − .086 − .071 .994 .997 − .953 .962 − .098 − .033 R = = .994 .026 .981 − .977 .026 − .040 − .059 − .098 .989 .990 .997 − .040 − .125 − .033 .990 .996
Oblique rotation(斜交轉軸)
允許因素間具共相關之轉軸 因素間最大的相關由δ(delta)決定, 負的δ越小,表示月接近直交, δ=-4為 直交, δ接近1時,因素間的相關可能最高 Direct oblimin:使因素負荷量的差累(cross-products)最小化 Direct quartimin:使型態矩陣中的負荷量平方的差累(cross-products)最小化 Orthoblique:使用quartimax計式將因素負荷量重新量尺化(rescaled)以產生直交 的結果,因此最後的結果保共斜交的性質 Promax:將直交轉軸(varimax)的結果再進行共相關的斜交轉軸。因素負荷量平2, 9 4,6次方以產生接近0但不為零的值,藉以找出因素間的相關,但仍保共最簡化因 素的特性
實務層次的問題
因素分析受到相關係數的特性所影響,任何影響相關係數的原因都可能干擾因 素分析 樣本數、遺漏值、常態性、線性關係、偏離值 多元共線性(multicollinearity)與單一性(singularity),極端的共線性與單一性個於 因素分析具共影響 相關係數的大小:如果觀察矩陣中相關係數均小於.3,抽平因素能力低,可能 需放棄使用因素分析 因素分析的偏離值:當某測量變項不被因素所解釋時。當僅共兩個變項所決定 的因素,可能是一種不穩定的因素。
相關矩陣R 上式可以轉成為R=AA’,A稱為因素負荷矩陣
特徵值矩陣L
R = VLV ′ = V L LV ' = (V L )( LV ' ) = AA′
15
因素負荷矩陣
前式可以轉成為R=AA’,A稱為因素負荷矩陣
R = VLV ′ = V L LV ' = (V L )( LV ' ) = AA′
A =V L
− .283 .651 .177 − .685 2.00 A= − .658 .252 .00 .207 .675 − .400 .900 .00 .251 − .947 = .348 1.91 .932 .286 .956
探索性因素分析: 主成分分析與因素分析
1
相關矩陣
Observed correlation matrix
由觀察變項計計得到的相關係數矩陣
Reproduced correlation matrix
由因素導出的相關係數矩陣
Residual correlation matrix
觀察相關係數矩陣與重重相關係數矩陣的差異
平平結果
PCA:
以最少的直交成分來解釋最大的變項變異量 具共單一的數學解
FA:
以最少的直交因素來反應相關矩陣 具共不同的最佳解
6
不同的平平方法一
主成分法(Principal components) 目的在使每一個成分能夠個表最大的觀察變異量 第一個主成分為觀察變項的線性整合,能夠反應最大的變異量, 依序發展各主成分 可以得到最大的解釋變異量 主要因素法(principal factors) 以共同性為分析的個象 因素的抽平以個個程序來進行,起始值為SMC(squared multiple correlations),反覆帶入共同性直到無改善 能夠產生最理想的重重矩陣 映像因素平平(image factor extraction) 各觀察變項的變異量為其他變項的投射。每一個變項的映像分數 係以多元迴歸的方法來計計,映像分數的共變矩陣被進行PCA 類似PCA,能夠產生單一的數學解,個角線與FA相同,為共同 性 因素負荷量不是相關係數,而是變項與因素的共變 7
相關矩陣中的個角線個表變項的標準化的變異量(1.00) 因素分析經由因素的平平個於觀察變項相關矩陣進行平平後,轉成 成為特徵值(L) L=V’RV V’V=I V稱為特徵向量
1.00 − .953 − .055 − .130 − .283 .651 − .283 .177 .658 .675 − .953 1.00 − .091 − .036 .177 − .685 2.00 .00 L= = .651 − .685 .252 .207 − .055 − .091 1.00 .990 − .658 .252 .00 1.91 1.00 .675 .207 − .130 − .036 .990
13
因素分析的範例解明
Cost
Cost of ski ticket S1 S2 S3 S4 S5
Lift
Speed of ski lift
Depth
Depth of snow
Powder
Moisture of snow
32 61 59 36 62
Cost Cost Lift Depth Powder
Pattern matrix型態矩陣
斜交轉軸後各觀察變項與因素間排除因素間相關後之相關係 數矩陣 為斜交轉軸可以反應因素意義的係數
Factor score coefficients matrix因素分數係數矩陣
用以反應因素得分的類迴歸方程式係數矩陣
3
因素分析的目的與問題
因素分析的主要目的在將繁多的變項縮減為少 數的因素,找出變項背後的結構,涉及下列問 題的探討
16
直交轉軸
Varimax法:將因素負荷量的變異數最大化 將高相關更高,低相關更低(19度轉軸)
ΑunrotatedΛ = Αrotated
cos Ψ − sin Ψ Λ= sin Ψ cos Ψ
Α rotated − .400 .900 − .086 .981 .251 − .947 .946 .325 − .071 − .977 = .325 .946 = .994 .932 .348 .026 .286 .956 .997 − .040
2
因素分析的各類矩陣
Orthogonal rotation直交轉軸
所共的因素不具共相關的轉軸結果
Oblique rotation斜交轉軸
因素間具共相關的轉軸結果
Loading matrix因素負荷矩陣
直交轉軸後各觀察變項與因素間的相關係數矩陣
Structure matrix結構矩陣
斜交轉軸後各觀察變項與因素間的相關係數矩陣
Alpha 因素平平 法
1 -.086 -.071 .994 .997 1.997 49.93 1.995 49.87 97.85 2 -.981 .977 -.026 .040 1.917 47.92 1.919 47.99
映像因素平平 法
1 -.086 -.071 .993 .993 1.984 49.61 1.983 49.59 96.35
8
Rotation 轉軸
轉軸的時機
依目的:得到最佳的結構,或保留因素的原始面貌 利用因素散佈圖協助判斷:觀察變項應在各軸上:接近各軸,遠離原點,形成群 落
Orthogonal rotation(直交轉軸)
Varimax:使負荷量的變異數在因素內最大( Г =1) Quartimax :使負荷量的變異數在變項內最大( Г =0) Equamax :綜合前兩者,使負荷量的變異數在因素內與變項內同時最大( Г =.5) Г(gamma)指標:表示簡化的程度:0表變項最簡化,1表因素最簡化,.5表兩者 各半