当前位置:文档之家› 统计学-相关与回归分析ppt课件

统计学-相关与回归分析ppt课件


F值 F MSR
MSE
.
14
模型评价-显著性检验2
• 单个回归系数的检验
(1)要检验的假设:H 0 : i 0 ;H1 : i 0 (i=1,2,……,p)
^
(2)t 检验的计算公式为: ti
i
S i
,其中 Si 是回归系数
标准误,t 值应该有 p 个
(3)给定显著性水平α,确定临界值 t / 2 (n p 1)
相关程度、 相关方向、 相关形式、 变量多少、 相关性质
二、线性相关关系的识别
(一)散点图 (例子)
最简单、最直观的识别方法, 但难以给出相关的程度.
(二)直线相关系数
直线相关系数的设计思想 总体相关系数与Pearson相关系数 相关系数的检验
.
7
三、一元线性回归分析
一元线性回归模型的概念
y01x 变量y对x的一元线性回归总体模型
(1) 把非线性关系转化为线性关系,然后再运用线性回 归的分析方法进行估计。
(2) 利用非线性最小二乘法直接估计 非线性模型转换成线性模型的常用方法:直接和间接代换法
例1:太阳镜的日销售数量 Y 与日最高气温 X 之间的关系
例2:人均消费与人均GDP的关系
.
2
相关分析与回归分析
相关分析
用一个指标来表明现象间相互依存关系 的密切程度。
回归分析
根据相关关系的具体形态,选择一个合 适的数学模型,来近似地表达变量间关系。
相关分析所研究的变量是对等关系;回归分析所
研究的两个变量不是对等关系。
(4)若 F F ( p, n p 1) ,则拒绝 H 0 ,说明总体回归系数 i 不
全为零,即回归方程是显著的;反之,则认为回归方程不显著。
表 10.4 多元线性回归模型的方差分析表 方差来源 平方和 自由度 均方
回归
SSR
p
MSR SSR p
误差 总计
SSE SST
n-p-1 n-1
MSE SSE n p 1
第九章
相关相与关回回归归分析
南京财经大学统计学系
相关分析与回归分析是现代统计学中非常重要的内容,在 自然、管理科学和社会经济领域有着十分广泛的应用。
在分析变量之间关系的时,常用的基本模型: (1)相关模型; (2)回归模型
实践中到底使用哪种模型取决于研究者的研究目的和数据 的收集方式和条件。相关分析: 变量 X 和 Y 都被视为随机 变量,服从二元分布;经典的回归分析: 通常变量 x 不是 随机变量,在事先选好的值中取值,变量 Y 是随机变量, 在变量 x 的给定值处有相应的观测值。
基本概念:回归系数、被解释变量(因变量)、解释 变量(自变量)、多元回归、 随机误差项。
多元线性回归模型的样本形式:
y1 0 1x11 2 x12 ...... p x1p 1 y2 0 1x21 2 x22 ...... p x2 p 2
......
yn 0 1xn1 2 xn2 ...... p xnp n
3300
2800
2300
1800 4.300
5300
6300
7300
8300
人均GDP 9300 4
本章内容
一、相关关系的概念和分类 相

二、线性相关关系的识别
分 析
三、一元线性回归分析
四、多元线性回归分析 New
五、非线性回归分析
New
.
5
一、相关关系的概念和分类
一、函数关系和相关关系 二、相关关系的分类
(4)若 ti t /2 ,则拒绝 H 0 ,即总体回归系数 i 0
有多少个回归系数,就要做多少次 t 检验。
.
15
EXCEL演示和解释
.
16
五、非线性回归分析
线性回归模型的结构特点: (1)被解释变量是解释变量的线性函数—变量线性 (2)被解释变量也是参数的线性函数—参数线性
根据实际分析建立的模型往往不符合上述线性特点,称为 非线性模型。如: 柯布—道格拉斯生产函数 YALK 处理非线性回归模型的方法有两种:
写成矩阵形式为:Y X ε
.
9
1 x11 x12 ...... x1p
X
1
x21
x22
.......
x2
p
....... ...... ...... ...... ......
1
xn1
xn2
......
xnp
;
y1
0
1
Y
y2
...... ;
yn
1
......
p

2
......
n
.
10
基本假设
解释变量是确定性变量,不是随机变量,且要求矩 阵X中的自变量列之间不相关,样本容量的个数应 大于解释变量的个数。 独立、同分布、零均值
正态分布的假定条件:
i~ N (0 , 2 )i, 1 ,2 , ,n
.
11
参数估计
• 与一元线性回归方程的参数估计原理一样, 应该使得估 计值与观测值y之间的残差在所有样本点上达到最小, 即使Q达到最小
Q n(y i y ^ i)2ne i2 e T e (Y X ˆ)T (Y X ˆ)
i 1
i 1
• 参数的最小二乘估计值为:
• 另外,
βˆ(X'X)1X'Y
^
ˆ Sy(x1xp)
(yi yi)2 np1
.
12
模型评价-拟合优度
• 一般不再用可决系数
r2 SSR yˆi y2
因果
.
3
年份 人均国内生产总值 人均消费金额
yபைடு நூலகம்ar
x
y
1995
4854
2236
1996
5576
2641
1997
6054
2834
1998
6308
2972
1999
6551
3138
2000
7086
3397
2001
7651
3609
2002
8214
3818
2003
9101
4089 4300
人均消费
3800
E (Y|x)01x 一元线性回归方程
yˆˆ0 ˆ1x 一元线性经验回归方程
New
估计方法:普通最小二乘估计 、标准误差 — 的估计
模型评价:可决系数、显著性检验1 2
预测方法:点预测,区间预测
将代入回归方程得=181.5830+0.4414×10000=4595.5628(元)
.
8
四、多元线性回归分析
SST
2
yi y
• 而是用修正的可决系数
ra21(1r2)nnp11
.
13
模型评价-显著性检验1
• 整个回归方程的检验
(1)提出假设 H0 : 1 2 p 0 , H1 : 1, p 不全为 0.
(2)根据表 10.4 构建 F 统计量,见表 10.4 (3)给定显著性水平α,查 F 分布表,得临界值 F ( p, n p 1) 。
相关主题