当前位置:文档之家› 气象统计方法一元线性回归分析

气象统计方法一元线性回归分析


5. 相关系数与线性回归----
(1)因为回归方差不可能大于预报量的 方差,可以用它们的比值来衡量方程的拟 合效果。即:
S
2 yˆ
S
2 y
1 n 1 n
n
( yˆi y)2
i 1
n
( yi y)2
i 1
U S yy
n
n
S
2 yˆ
(a bxi
i 1
a bx)2
b2 (xi
i 1
2 2
n
i 1 n
i 1
( yi ( yi
a a
bxi bxi
) ) xi
0
0
上式称为求回归系数的标准方程组。展
开:
na
b
n i 1
xi
n i 1
yi
a
i
n 1
xi
n
b
i 1
xi2
n i 1
xi yi
回归系数也可直接表示为:
a y bx
b
n i一元回归处理的是两个变量之间 的关系,即一个预报量和一个预报 因子之间的关系。
3.原理
一般来说,对样本量为n的预报量y与预报
因子x的一组样本,如果认为y与x是一种线 性统计关系,预报量的估计量与x有如下关 系:
yˆi a bxi (i 11),2, , n
或者写为一般的回归方程
i 1
y)2
1 n
n
( yˆi
i 1
y)2
1 n
n
( yi
i 1
yˆi )2
方差分析表明,预报量y的变化可以看成由前期 因子x的变化所引起的,同时加上随机因素e变化的 影响,这种前期因子x的变化影响可以归为一种简 单的线性关系,这部分关系的变化可以用回归方差 的大小来衡量。如果回归方差大,表明用线性关系 解释y与x的关系比较符合实际情况,回归模型比较 好。
如:为了预报某地某月平均气温 (预报量)未来时刻的变化,选择预报 前期已发生的多个有关的气象要素(预 报因子),利用回归分析方法分析多个 预报因子和预报变量之间的相互关系, 建立统计关系方程式,最后利用其对未 来时刻的气温作出预报估计。
回归模型的类型
回归模型
一元回归
多元回归
线性回归 非线性回归 线性回归 非线性回归
=r2
(2)回归系数b与相关系数之间的关系
b
S xy
S
2 x
Sy Sx
rxy
r与b同号。
6. 回归方程的显著性检验
U
F
1 Q
(n 2)
原假设回归系数b为0的条件下,上述统计量遵从
分子自由度为1,分母自由度为(n-2)的F分布,
若线性相关显著,则回归方差较大,因此统计量F
也较大;反之,F较小。对给定的显著性水平 ,
有时候,两边同时乘以n变成各变量离差平方和的关 系。
n
n
U ( yˆi y)2 Q ( yi yˆ)2
i 1
i 1
S yy U Q
U和Q分别称为回归平方和及残差平方和, S y称y 为总
离差平方和。
1.总离差平方和( S yy )
反映因变量的 n 个观察值与其均值的总离差。
2.回归平方和(U)
气象统计方法
主讲:温 娜
南京信息工程大学 大气科学学院 2014年9月
本课件主要参考南信大李丽平老师的课件
第四章 一元线性回归(huang28)
主要内容
概述 基本概念 原理 方差分析 相关系数和线性回归 回归方程的显著性检验
1.概述
回归分析是用来寻找若干变量之间 的统计联系一种方法,利用找到的 统计关系对某一变量作出未来时刻 的估计,称为预报值。包括线性回 归和非线性回归,常用的线性回归。
标准化距平形式的回归方程: y* rxy x*
b
S xy
S
2 x
Sy Sx
rxy
4.回归问题的方差分析
(1)意义 评价回归方程的优劣。
(2)预报量的方差可以表示成回归估计值 的方差(回归方差)和误差方差(残 差方差)之和。
S
2 y
S
2 yˆ
Se2
即:
预报量方差
回归方差
误差方差
1
n
n
( yi
x)2
b
2
S
2 x
S
2 y
n
(yi y)2
n
(yi y)2
S
2 y
i 1
i 1
b代入上式得:
b
S xy
S
2 x
S
2 yˆ
S
2 y
rx2y
上式含义:
表明了预报因子x对预报量y方差的线性 关系程度,这一比值又称为解释方差(方差 贡献率)。
也可以说明相关系数的含义:它是衡量两 个变量线性关系密切程度的量,又被称为 回归方程的判决系数。
(xi , yi)
yˆ ˆ0 ˆ1x
x
全部观测值与回归估计值的离差平方和记为
n
Q(a, b) ( yi yˆi )2 t 1
它刻画了全部观测值与回归直线偏离程度。
显然,Q值越小越好。a和b是待定系数,根 据
微积分学中的Q极值0 原理,要Q求 :0
a
b
满足上面关系的Q值最小。整理得到:
反映自变量 x 的变化对因变量 y 取值变化的影响,或 者说,是由于 x 与 y 之间的线性关系引起的 y 的取 值变化,也称为可解释的平方和。
3.残差平方和(Q)
反映除 x 以外的其它因素对 y 取值的影响,也称为 不可解释的平方和或剩余平方和。
2
n i 1
(
yi
a
bxi
)
0
n
2 i1 ( yi a bxi )xi 0
1 n
(
n i 1
n
xi )(
i 1
yi
)
n i 1
xi2
1 n
n
(
i 1
xi )2
n
xi yi nxy
i 1
n
xi2 nx 2
i 1
S xy
S
2 x
上述求回归系数的方法称为最小二乘法
距平形式的回归方程: 即当变量为距平时,回归方程可以不用求a, 因为a=0,回归直线通过原点。
yˆ y b(x x)
判决系数R2 (coefficient of determination)
1. 回归平方和占总离差平方和的比例; 2. 反映回归直线的拟合程度; 3. 取值范围在 [ 0 , 1 ] 之间; 4. R2 1,说明回归方程拟合的越好;
R20,说明回归方程拟合的越差; 5. 判决系数等于相关系数的平方,即R2
查表得到F临界值 F,如果 F,则 F拒 绝原假设,
认为线性相关显著。
上式还可以表示为:
S
2 yˆ
F
1
S
2 e
(n 2)
r2
1 r 2 S
2 y
S
2 yˆ
S
2 e
yˆ a bx
a是截距,b是斜率。
对所有的 ,x若i 与 yˆ i 的偏差y最i 小, 就认为(1)所确定的直线能最好地代表所 有实测点的散布规律。
为了消除偏差符号的影响,可以用偏差的 平方来反映偏差的绝对值偏离情况。
y
(xn , yn)
(x2 , y2)
(x1 , y1)
} ei = yi^-yi
相关主题