当前位置:文档之家› 一般线性回归模型

一般线性回归模型

SPSS_相關性:分析 → 相關 → 雙變數 選擇 Pearson相關係數
SPSS_迴歸:分析 → 迴歸方法 → 線性 指定 依變數 自變數
SAS_相關性: Analysis → Descriptive → Correlation Columns:指定 Correlations variables Correlation: ˇ Pearson
F
p-value
F*=MSR / MSE p
註: F* 值用於檢定 Y 與 X 諸變數是否有迴歸關聯
H 0 : 1 1 ... 0 H 1 : 0 for some i
p >α, 則結論為迴歸式不顯著。 p <α, 則結論為迴歸式顯著。
決定係數 (coef. of determination, R2)
較標準 。
R 2 1 SSE /(n p 1) SST O /(n 1)
預測變數相關性的影響:
➢ 由簡單相關係數矩陣可以看出變數間相關性之強度。 ➢ 由檢定 H0 : ρ= 0 vs. Ha : ρ ≠0 決定變數間是否相關; 若 p-值 < α,結論為顯著相關。 ➢ 兩預測變數的簡單相關係數相當大時,則其迴歸結果有共 線性的現象存在,此時迴歸式的不準度性很高,應做修正。 (p483)
第十八章 迴歸分析
一般線性迴歸模型 (GLM)
資料: (yi , x i1 , ……, x ip ) i=1,….,n 模式: Yi = β0+ β1X i1 +…….+ βpX ip+ εi,
i=1,….,n
其中
Yi β0 β1, …, βp Xij εij
為依變數 (dependent var.) 為截距 (intercept) 為係數
0.6582 0.5262
0.9902
diam; diam;
0.58814 0.76367 0.00347 1.00000 0.0211 0.0009 0.9902
age, high 對 diam的影響較強;treeno 與 diam相關性不顯著, age與 high 相關性很強,可能有共線性影響 。
多項式迴歸式; 如: E(Y) =β0+β1X1+ β2 X12
轉換變數迴歸式; 如: E(log(Y)) =β0+β1X1+β2 X2 E(Y) =β0+ β1 log(X1) + β2 X22
變異來源 迴歸 誤差
合計
變異數分析表
SS SSR SSE SSTO
df p n-p-1
n-1
MS MSR MSE
由 t-為經由其它變數
的調整後,Xi 對 Y 影響顯著。
係數之區間估計: βi 估計範圍在 bi ±tα/2;n-p-1 SE{bi}
【例 18.3b】 研究某林區樹木之年齡(X1),株高(X2),以及單位面積上 株數(X3) 對樹木直徑(Y)的影響。 Data : p481
SAS_迴歸: Analysis → Regression → Linear Columns:指定 Dependent variables Explanatory variables
變數間相關性
Pearson Correlation Coefficients, N = 15 Prob > |r| under H0: Rho=0
age
high treeno
diam;
age
1.00000 0.90793 0.12458 0.58814
age
<.0001 0.6582 0.0211
high high
0.90793 1.00000 0.17777 0.76367
<.0001
0.5262 0.0009
treeno treeno
0.12458 0.17777 1.00000 0.00347
R 2 SS 1 SS
SS
SS
說明 : 1. R2表示 Y 之總變異中由 X1,…,Xp 解釋的比例
2. 0≦R2≦1
3. R2 值的大小通常代表迴歸式解釋程度的多少。
評論 : 1. 增加 X 變數個數 , 一定使 R2 值增加 。 2. 高的 R2 值並不一定表示配套的模式適合 。 3. 有些學者建議以 X 變數個數調整後的校正判定係數( Ra2) 為比
兩個自變數的一階模式; 如: E(Y) =β0+β1X1+β2 X2 若 X1 對平均反應的效應和X2 無關, 而 X2 對平均反應的效應和 X1 無關, 則稱此兩自變數無交互作用 (no interaction), 即自變數對反應變數的效應是可加的 , 或無交互作用的。
迴歸係數的意義
參數β1:經過 X2 調整,平均反應(Y)隨 X1 之每一單位增加而改變的量。 參數β2:經過 X1 調整,平均反應(Y)隨 X2 之每一單位增加而改變的量。
兩個自變數含交互作用項的一階模式; 如: E(Y) =β0+β1X1+β2 X2 + β3X 1 X2
二次完全迴歸式; 如: E(Y)=β0+β1X1+ β2 X12 +β3 X2 + β4 X22 + β5X 1 X2 E(Y)為一曲面, 稱為 regression surface 或 response surface
考慮三個自變數的迴歸分析
Parameter Estimates
D
Variable Label
F
Intercept Intercept 1
age
age 1
high
high 1
treeno
treeno 1
Parameter Estimate 4.33469 -0.13272 0.09306
見例18.3b
相關係數與決定係數: • 相關係數量測兩變數間單純的相關性強度。 • 決定係數量測一變數與其他多個變數間的相關性強度。 • 在一個自變數問題上,決定係數是相關係數的平方值。
係數之顯著性與區間估計:
檢定第 i自變數(Xi)對依變數 (Y) 影響之顯著性:
H0 : βi = 0
Ha : βi ≠0
為預測變數 (independent var.) 為隨機誤差項 (error)
註解 :
線性迴歸模型意指其對參數為線性的方程式,有 p 個預測變數 , 可為數量或質性變數 。 E(Y) = β0+ β1X 1 +…….+ βp X p 估計式:Y= b0+ b1X 1 +…….+ bp X p
特殊模式
相关主题