当前位置:文档之家› 统计学相关及回归分析

统计学相关及回归分析

第九章 相关回归 相关与回归分析
南京财经大学统计学系
相关分析与回归分析是现代统计学中非常重要的内容,在 自然、管理科学和社会经济领域有着十分广泛的应用。
在分析变量之间关系的时,常用的基本模型: (1)相关模型; (2)回归模型 实践中到底使用哪种模型取决于研究者的研究目的和数据 的收集方式和条件。相关分析: 变量 X 和 Y 都被视为随机 变量,服从二元分布;经典的回归分析: 通常变量 x 不是 随机变量,在事先选好的值中取值,变量 Y 是随机变量, 在变量 x 的给定值处有相应的观测值。 例1:太阳镜的日销售数量 Y 与日最高气温 X 之间的关系 例2:人均消费与人均GDP的关系
变量多少、 相关性质
二、线性相关关系的识别
(一)散点图 (例子)
最简单、最直观的识别方法, 但难以给出相关的程度.
(二)直线相关系数
直线相关系数的设计思想 总体相关系数与Pearson相关系数
相关系数的检验
三、一元线性回归分析
一元线性回归模型的概念
y 0 1 x 变量y对x的一元线性回归总体模型
(3)给定显著性水平α ,查 F 分布表,得临界值 F ( p, n p 1) 。
), ( 4) 若F F 则拒绝 H 0 , 说明总体回归系数 i 不 ( p, n p 1
全为零,即回归方程是显著的;反之,则认为回归方程不显著。 表 10.4 多元线性回归模型的方差分析表 方差来源 平方和 自由度 均方 回归 误差 总计 SSR SSE SST p n-p-1 n-1
写成矩阵形式为: Y X ε
x11 x12 1 1 x x 21 22 X ....... ...... ...... x n1 x n 2 1
x1 p ....... x 2 p ...... ...... ; ...... x np ......
E (Y | x) 0 1 x
一元线性回归方程
ˆ ˆ x 一元线性经验回归方程 ˆ y 0 1
估计方法:普通最小二乘估计 、标准误差 — 的估计 模型评价:可决系数、显著性检验1 2
New
预测方法:点预测,区间预测
将代入回归方程得=181.5830+0.4414×1000Байду номын сангаас=4595.5628(元)
4300
5300
6300
7300
8300
人均GDP 9300
本章内容
一、相关关系的概念和分类 二、线性相关关系的识别
相 关 分 析
三、一元线性回归分析
四、多元线性回归分析 五、非线性回归分析
New
New
一、相关关系的概念和分类 一、函数关系和相关关系
二、相关关系的分类
相关程度、 相关方向、 相关形式、
相关分析与回归分析
相关分析
用一个指标来表明现象间相互依存关系 的密切程度。
回归分析 根据相关关系的具体形态,选择一个合 适的数学模型,来近似地表达变量间关系。
相关分析所研究的变量是对等关系;回归分析所 研究的两个变量不是对等关系。 因果
3800 3300 2800 2300 1800
人均消费
年份 人均国内生产总值 人均消费金额 year x y 1995 4854 2236 1996 5576 2641 1997 6054 2834 1998 6308 2972 1999 6551 3138 2000 7086 3397 2001 7651 3609 2002 8214 3818 2003 9101 4089 4300
0 1 y1 y 1 2 2 Y ...... ; ...... ...... ; n yn p
基本假设
解释变量是确定性变量,不是随机变量,且要求矩 阵X中的自变量列之间不相关,样本容量的个数应 大于解释变量的个数。 独立、同分布、零均值 正态分布的假定条件:
四、多元线性回归分析
基本概念:回归系数、被解释变量(因变量)、解释 变量(自变量)、多元回归、 随机误差项。
多元线性回归模型的样本形式:
y1 0 1 x11 2 x12 ...... p x1 p 1 y2 0 1 x21 2 x22 ...... p x2 p 2 ...... yn 0 1 xn1 2 xn 2 ...... p xnp n
MSR
MSE
F值
MSR MSE
SSR p
SSE n p 1
F
模型评价-显著性检验2
• 单个回归系数的检验
(1) 要检验的假设:H 0 : i 0 ;H1 : i 0 (i=1,2,……,p)
i (2)t 检验的计算公式为: t S ,其中 S 是回归系数
i ~ N (0, 2 ) i, 1, 2, , n
参数估计
• 与一元线性回归方程的参数估计原理一样, 应该使得估 计值与观测值y之间的残差在所有样本点上达到最小, 即使Q达到最小
ˆ )T (Y X ˆ) Q ( yi yi ) 2 ei2 eT e (Y X
i i
y
y
2 2
• 而是用修正的可决系数
n 1 r 1 (1 r ) n p 1
2 a 2
模型评价-显著性检验1
• 整个回归方程的检验
H : 2 p 0 H1 : 1 , p (1)提出假设 0 1 , 不全为 0. (2)根据表 10.4 构建 F 统计量,见表 10.4
i 1 i 1
n
^
n
• 参数的最小二乘估计值为:
• 另外,
ˆ ( X ' X )1 X ' Y β
2 ( y y ) i i ^
ˆ S y ( x x )
1 p
n p 1
模型评价-拟合优度
• 一般不再用可决系数
SSR r SST
2
ˆ y y
相关主题