第09章线性回归计算
SSR 回归均方 MSR 1
(9-10)
误差均方
SSE MSE n2
(9-11)
第九章
一元线性回归
9.4 样本确定系数与样本相关系数
9.4.1 样本确定系数
SSR SSTO SSE SSE r 1 SSTO SSTO SSTO
2
(9-12)
注:Y的总变差中能被X解释的那部分所占的比率
i 1 i 1
n
n
2
2 ( X X ) i i 1 n
所以,b1服从 N ( 1 , n
2
)
i 1
( X i X )2
第九章
一元线性回归
9.5.2 F 检验
在一元线性回归中,为了检验Y对于X线性 关系的统计显著性,对β1进行F检验
1)提出假设:H0:β1=0,H1:β1≠0。
(1) 线性特性 由(9-5)得
b1 i 1
( X i X )(Yi Y )
i 1
n
(Xi
n
i 1
n
( X i X )Yi ( X i X )2
n
X )2
i 1
令
Ci
Xi X
则
(X
i 1
n
i
X )2
b1 Ci Yi
i 1
n
表明b1是Yi 的线性组合
第九章
一元线性回归
9.3 总平方和分解
9.3.1 总平方和分解
ˆ Y ˆ Y Yi Y Yi Y i i
(Y
i 1
n
n
i
ˆ )(Y ˆ Y) 0 Y i i
(Yi Y )
i 1
2
2 ˆ ˆ ( Y Y ) ( Y Y ) i i i 2 i 1 i 1
X Y
i 1 i n i 1
n
i
2
( X i )( Yi ) n ( X i ) 2 n
(9-5)
Xi
b0 Y b1 X
(9-6 )
第九章
一元线性回归
9.2.5 最小二乘估计量b0,b1的特性
线性性 b0,b1的特性 无偏性
第九章
一元线性回归
9.2.5 最小二乘估计量b0,b1的特性
SSR
2) 构造并计算统计量:
F
fR fE
SSE
3)查F分布临界值表,得临界值 F (1, n 2)
F F (1, n 2) 接受H0,认为Y与 4)比较: X不存在一元线性关系。
第九章
一元线性回归
9.5.2 F 检验
若F> F (1, n 2) 拒绝H0,认为Y与X存在一元线性关系。
第九章
一元线性回归
9.5 一元线性回归显著性检验
在回归函数E(Y)=β0+β1X中,如果β1=0,则对于X的一切水 平E(Y)=β0,说明Y的变化与X的变化无关,因而,我们不能 通过X去预测Y。所以,对模型Yi=β0+β1Xi+εi 检验β1=0是 否成立,等价于检验Y与X之间是否存在线性关系。
第九章
±0.8~1
±0.5~0.8 ±0.3~0.5 ±0~0.3
第九章
r的取值情况
一元线性回归
9.4.2 样本相关系数
情况一
图9-6
第九章
一元线性回归
9.4.2 样本相关系数
情况二
图9-7
第九章
一元线性回归
9.4.2 样本相关系数
情况三
图9-8
第九章
一元线性回归
9.4.2 样本相关系数
情况四
图9-9
第九章
一元线性回归
9.2.5 最小二乘估计量b0,b1的特性
b0 k i Yi
同理,可得
i 1
n
1 k i Ci X n
b0 是Yi 线 性组合
第九章
(2) 无偏性
一元线性回归
9.2.5 最小二乘估计量b0,b1的特性
可以证明b0和b1分别是β0 和β1的无偏估计 (过程比较繁琐,参照第五章内容 有兴趣大家自己证明。)
一元线性回归
9.5.1 b1的抽样分布
为了检验β1=0是否成立,需要构造一 个合适的统计量,因此,首先讨论b1 的抽样分布。
第九章
一元线性回归
9.5.1 b1的抽样分布
b1是观测值Yi的线 性组合 b1也服从正态分布 Yi服从正态分布且 相互独立
第九章
一元线性回归
9.5.1 b1的抽样分布
以下可以证明
第九章
一元线性回归
9.1.2 回归分析
回归分析(Regression Analysis)
就是应用统计方法,对大量的观测数据进行整 理、分析和研究,从而得出反映事物内部规律 性的一些结论(数学模型)。
第九章
9.2
一元线性回归
一元线性回归模型
• 9.2.1 统计关系的特征
因变量Y随自变量X有规律的变化,而统 计关系直线描述了这一变化的趋势。 观测点散布在统计关系直线的周围,此 种情况说明Y的变化除了受自变量X 影响以外,还受其他因素的影响。 因此试图建立这样一个回归模型,通过对此模型 所作的一些假设,可以体现出上述统计关系所刻划的特征。
Yi=β0+β1Xi+εi (i=1,2,···,n)
其中,(X i,Yi)表示(X,Y)的第i个观测值,β0 , β1 为参数,β0+β1Xi为反映统计关系直线的分量, ε i为反映在统计关系直线周围散布的随机分量 ε i~N (0,σ2)。
第九章
一元线性回归
9.2.3 一元线性回归模型
对于任意Xi值有:
第九章
一元线性回归
样本的全部观察值都落在 所拟和的回归直线上 SSE=0,
9.4.1 样本确定系数
r2=1
r2的取值范围
0 r2 1
当X与Y无关,Y的变差完 全由于随机因素引起, 此时,SSR=0 r2=0
第九章
一元线性回归
9.4.2 样本相关系数
样本相关系数
r r
2
r
(X
i 1 n i 1
r (n 2)
第九章
一元线性回归
9.5.4 利用样本相关系数进行统计检验
若
4)比较 若
r r
,接受H0
r r
,拒绝H0
第九章
例题
一元线性回归
• 某市欲对货运总量与工业总产值的数量关系进行研究, 以便通过工业总产值预测货运总量。现将2001-2010年 的数据,列入下表:
货运总量(亿吨) 2.8 2.9 3.2 3.2 3.4 3.2 3.3 3.7 3.9 4.2
第九章
一元线性回归
9.2.4 一元线性回归方程
Yi =β0 +β1 Xi +εi β0和β1均未知 根据样本数据 对β0 和β1 进行估计
β0和β1的估计
值为b0和b1
建立一元线性回归方程
ˆ b b X Y 0 1
第九章
一元线性回归
9.2.4 一元线性回归方程
一般而言,所求的b0和b1应能使每个样本观测点(X i,Y i) 与回归直线之间的偏差尽可能小,即使观察值与拟 合值的误差平方和Q达到最小。
若
4)比较
t t / 2 (n 2)
,接受H0
若
t t / 2 (n 2)
,拒绝H0
第九章
一元线性回归
9.5.4 利用样本相关系数进行统计检验
步 骤: 1)提出假设
H0:ρ =0 H1 :ρ 0
ρ是总体Y 与X的线性 相关系数
2)计算简单相关系数r
3)查相关系数临界值表
得临界值
第九章
一元线性回归
9.3.1 总平方和分解
( Yi ) 2
i 1 n
SSTO Yi
2 i 1
n
n
SSR b1 [ X i
2 2 i 1
n( X i ) 2i 1 Nhomakorabean
n
]
SSE=SSTO-SSR
第九章
一元线性回归
9.3.2 自由度的分解
n
SSTO
i 1
(Yi Y ) 0
表9-1 方差分析表
第九章
步 骤: 1)提出假设
一元线性回归
9.5.3 t 检验
H0 : H1 :
b1 t s (b1 )
1 0 1 0
s (b1 ) MSE
2)构造并计算统计量
(X
i
X )2
3)查t分布临界值表
得临界值 t / 2 (n 2)
第九章
一元线性回归
9.5.3 t 检验
nb0 b1 X i Yi
n
n
令偏导数为0
i 1
i 1
解方程
b0 X i b1 X i X i Yi
2 i 1 i 1 i 1
n
n
n
第九章
一元线性回归
(X
i 1 n i 1 n
9.2.4 一元线性回归方程
b1
i
X )(Yi Y )
2 ( X X ) i
第九章
一元线性回归
回归分析适合研究哪类问题? 回归方程的显著性检验适合什么情况? 回归系数的显著性检验适合什么情况?
第九章
一元线性回归
9.1 回归分析的基本概念
• 9.1.1 因变量(Y)与自变量(X)之间的关系 根据因变量与自变量之间的关系不同,可以分为两种类型: 函数关系