当前位置:文档之家› 最新第7章 相关与回归分析

最新第7章 相关与回归分析

22
23
二、回归模型和回归方程
y 0 1x
y :因变量(随机变量)
x :自变量(给定变量)
0、1 :参数
(7.4)
:误差项(随机变量),含义为说明在 y 中不能
被 x 和 y之间线性关系解释的变异性。
24
在有关 假设中,有一个假设就是的期望值
或均值等于0,即
E 0
(7.5)
如果简单线性回归模型满足了这个条件,那
12 73764 9302
12
2.相关系数的应用 a.相关系数的取值范围
r 的取值在-1和1之间,即 r 1
b.正负相关的判断 当 r >0时为正相关;当 r<0时为负相关。
13
c.相关密切程度的判断 当 r 1 时,相关关系越密切,当 r 1
说明X与Y之间完全相关,即函数关系;当 rxy 0 时,
相关关系越不密切,当 =r0,说明X与Y之间不存在
33
(一)画散点图,以初步观察成本与乘客数量之间 是否呈回归直线。
34
(二)建立估计回归方程
yˆi b0 b1xi i 1,2,,12 (7.8)
最小平方法运用样本数据求出 b0和 b1 的值,使
得因变量的实际观察值 yi与其估计值 yˆi之差的平方
和最小,即
yi yˆi 2 min (7.9)
35
(三)估计回归方程斜率和截距的计算公式
b1
xi yi x y
x2
2
nx
b1
n xi yi xi
n x2 x2
yi
b0 y b1 x
7.10 a 7.10 b
(7.11)
36
37
b1
n
xi yi n x2
xi yi x2
12 4462.220 930 56.690
16
第二节 简单线性回归模型
17
只涉及两个变量(一个自变量和一个因变量)之 间关系的回归分析称为简单回归分析。
两个变量之间的关系大约呈一条直线的简单回归 分析称为简单线性回归分析。
18
一、从一个实际问题入手
用回归分析可以预测运行一条商业航空线的成本 吗?
如果可以,那么哪些变量与这一成本有关呢?
么就意味着 y 的均值或期望值就是一个线性函数。
描述 y 的均值与 x 的关系如何的方程称为
回归方程。
25
Ey 0 1x
在简单线性回归中
(7.6)
1.回归方程的图形是一条直线(如图7.3所示);
26
27
2. 0 :y 的截距;
3.
:斜率(回归系数);
1
1 的含义:当自变量 x给定一个具体变动值时,因 变量 y 平均变化的量。
广告次数
销售额(百元)
1
38
1
41
2
46
2 3 3 4
50 48 54
4
54
5
59
5
63
6
二、双变量相关关系的测度方法
(二)相关图法
销售量(百美元)
70
60
50
40
30
20
10
0
0
2
4
6
广告次数
图7-1 立体声音响设备商店数据散点图
7
二、双变量相关关系的测度方法
(三)相关系数法 相关系数是用以衡量两变量间线性相关关系情
第7章 相关与回归分析
1
一、双变量相关关系的含义和种类
(一)双变量相关关系的含义
函数关系
相关关系
现象之间确定性的 数量依存关系
现象之间非确定性的 数量依存关系
2
一、双变量相关关系的含义和种类
(二)双变量相关关系的种类
相 相关方向 关 关 相关形式 系 的 种 类 相关程度
正相关和负相关
线性相关和 非线性相关
19
飞机型号
飞行距离 乘客数量
行李或货物重量
飞机运行成本
天气状况
……
20
为了减少自变量个数,我们做如下假定: 飞机类别——波音737飞机 飞行距离——500公里 航线——可比,而且在每年的相同季节 在这种条件下,可以用乘客数来预测飞行的成 本吗?
21
表7-3是每年相同季节波音737飞机在12条500公里 的不同航线不同乘客数时的飞行成本。我们用这些数 据以乘客数作为自变量构造模型来预测成本。
总体数据的相关系数
xy xy
(7.3)
11
[7-2] 根据表7-2相关数据,利用样本数据计算相
关系数。
r n x y x y
n x 2 x 2n y 2 y 2
1 016-2 39 0510
1 011-3 00 2 1 0265 -5716 20
990 0.93 106.93548
直线相关关系,但也许存在非线性相关关系。
14
在做具体判断时,有几个数量标准: r 0.3,称为微弱相关。一般情况下,将其视为 没有线性相关关系; 0.3≤ r 0.5,称为低度相关;
0.5≤ r 0.8 ,称为显著相关;
0.8≤ r 1 ,称为高度相关。
15
对上面计算结果的统计分析
计算结果表明,歌乐立体音响设备商店在过去 10周内,周末所做的广告次数与下一周的销售额之 间存在着高度线性正相关关系。
(一)相关表法 1.编制原始数据表如下表 7-1 立体声音响设备商店的原始数据
周次
广告次数
下一周销售额(百元)
1
2
2
5
50
3
1
57
4
3
41
5
4
54
6
1
54
7
5
38
8
3
63
9
4
411
46
5
二、双变量相关关系的测度方法
2.将原始数据表编制成相关表
表7-2 立体声音响设备商店的广告次数与销售额相关表
28
29
30
三、估计回归方程
估计回归方程 就是用样本统计量作为参数的 估计值所建立的回归方程。
yˆ b0 b1x
yˆ :y 的估计值
b0 :0 的估计值
b1 : 1 的估计值
(7.7)
31
32
四、 最小平方法
最小平方法,也称最小二乘法,是将回归模型的 方差之和最小化,以得到一系列方程,从这些方程中 解出模型中需要的参数的一种方法。
完全相关、不完 全相关和不相关
3
二、双变量相关关系的测度方法
【例7-1】歌乐音响设备商店于2014年7~9三个 月份中,连续10周使用了周末电视广告来提高商店的 销售额。商店经理想调查这段时间内播出的广告次数 和店内销售额之间是否存在某种关系。
问题:如果该经理将这项工作交给你,你该怎 样做呢?
4
二、双变量相关关系的测度方法
况下,相关方向和密切程度的相对数。
8
二、双变量相关关系的测度方法
1.相关系数的计算 样本相关系数的定义公式
rxy
s xy sxsy
(7.1)
9
2
sx
xi x n 1
2
sy
yi y n 1
10
样本数据的简捷公式
r
n x y x y
n x2 x2 n y2 y2
(7 .2 )
相关主题