当前位置:文档之家› 5.8 第五章 回归分析

5.8 第五章 回归分析


第一节 相关分析
(一)函数关系(确定性关系)
(1)是一一对应的确定关系; (2)设有两个变量 x 和 y ,变量 y 随变量 x 一起变 化,并完全依赖于 x ,当变量 x 取某个数值时, y 依确定的关系取相应的值,则称 y 是 x 的函数, 记为 y = f (x),其中 x 称为自变量,y 称为因变 量;
如果因变量y与自变量x的相关关系是近似直线
的关系,则一元线性回归的模型为:
ˆ a bx y ˆ ——y的估计值或预测值, y
a.b ——截距,回归系数。
确定了a与b的值,直线的位置也就相应地确定了。
第二节 一元线性回归分析
二、一元线性回归 3.参数估计-最小二乘法 设有一组试验数据(如表),若x,y符合线性关系 x y x1 y1 x2 y2 …… …… xn yn
第一节 相关分析
(二)决定系数
是相关系数的平方,用 r 2表示;用来衡量回归 方程对y的解释程度。
决定系数取值范围: 0 r 1
2
r 越接近于 1 ,表明 x 与 y 之间的 2 相关性越强; r 越接近于0,表
明两个变量之间几乎没有直线相 关关系。
第一节 相关分析
2
SPxy/SSx是以x为自变量、y为依变量时的回归
第一节 相关分析
(二)相关关系(非确定型关系) 指事物之间的关系数值存在着一定的依存关 系,但它们不是确定的和严格依存的,某一现象 在其发展变化中,当数量上为一确定值时,与之 有联系的其他现象可以有若干个数值与之对应, 在这些数值之间表现出一定的波动性,但这些值 按某种规律在一定范围内变化。
第一节 相关分析
2、变量 x、 变量 y处于 平等地位。 3、变量 x 和 y 都是随机 变量
Y是因变量,是随机变量; x 是自变
量,是确定变量。可以建立y依x或 x依y两个回归方程。
4、可以计算一个相关系数。 相关系数取值范围在 0到正负1之间
可以计算两个回归系数。回归系数 取值可为正负数、且取值范围不限
第二节 一元线性回归分析
第一节 相关分析
三、相关分析
相关关系的一般判断
是依据研究者的理论知识和实践经验,对客观 现象之间是否存在相关关系,以及何种关系作 出判断。 在定性分析的基础上,通过编制相关表、绘制 相关图、计算相关系数等方法,来判断现象之 间相关的方向、形态及密切程度。
定性分析
定量分析
第一节 相关分析
第一节 相关分析
第二节 一元线性回归分析
二、一元线性回归 2. 一元线性回归方程 描述y的均值E(y)与 x的关系的方程叫做回归方 程。 E ( 1 ) 1 , E ( ) 0 由于 E ( 0 ) 0 , 所以 E ( y) 0 1 x 不难看出,简单线性回归方程的图形是一条直线。 这条直线被称为总体回归直线。 0 是回归直线的截 距, 1 是回归直线的斜率,E(y)是给定某个x的值y的 均值或期望值。 各实际观测点与总体回归线垂直方向的间隔,就是 随机误差项ε,即 y E ( y)
系数byx。 若把y作为自变量、x作为依变量 ,则
回归系数 bxy =SPxy/SSy ,所以决定系数r2等于y
对x的回归系数与 x对y的回归系数的乘积。这就
是说,决定系数反映了x为自变量、y为依变量和
y为自变量、x为依变量时两个相关变量x与y直线 相关的信息 ,即决定系数表示了两个互为因果 关系的相关变量间直线相关的程度。但决定系 数介于 0 和 1 之间,不能反映直线关系的性质 — 是同向增减或是异向增减。
第一节 相关分析 图5-1 广告费与年销售收入之间的相关图
相关图









完全正线性相关

正线性相关
非线性相关

Biblioteka
完全负线性相关
第一节 相关分析
二、相关关系的种类
线性相关
(一)按相关形式不同 非线性相关
正相关 (二)根据相关方向划分(在直线相关中) 负相关
第一节 相关分析
完全相关 (三)按相关的程度
不完全相关 不相关(零相关)
单相关 (四)根据相关关系涉及变量的多少 复相关 偏相关
第一节 相关分析
三、相关分析
主要内容 1.确定现象之间有无相关关系。 主要通过定性分析判断和相关图、相关表观察得出结 论。这是相关分析的出发点。 2.确定相关关系的表现形式。 若存在相关关系,就需进一步确定相互关系的表现形 式。例如,是线性相关还是非线性相关,这时相关分析的主 要内容。 3.确定相关关系的密切程度和方向。 通过相关分析,可以判定现象之间相关关系的密切程度和 方向。例如,变量之间是完全相关、不完全相关还是完全不 相关。
特点: ①相关系数有正负号。 ②分析时,两个变量是对等的。(不分自变量 和因变量,两者互换不影响计算结果。) ③抽样时,两个变量都是随机变量。 此外还有复相关系数、非线性相关系数等。
第一节 相关分析
相关系数的计算公式(皮尔逊相关系数)
r
( x x)( y y) ( x x ) y y
三、相关分析

(一)相关系数


1.简单相关系数的含义:反映密切程度和方向
2.简单相关系数的计算 3.相关系数的性质

(二)决定系数 (三)相关表和相关图


1. 相关表
2. 相关图
第一节 相关分析
(一)相关系数
1.简单相关系数的含义
相关系数 (correlation coefficient) ,又称积差
20 30 20 20 40 30 40 80 80 50 40 30 20 80 50 单位成本(元/小时) 18 16 16 15 16 15 15 14 14 15 15 16 18 14 14
完成量(小时)
20 50 20 30 50 20 50 40 20 80 40 20 50 80 30 单位成本(元/小时) 16 16 18 16 15 18 15 14 16 14 15 16 14 15 15
完成量(小时)
整理后有
20 20 20 20 20 20 20 20 20 30 30 30 30 30 40 单位成本(元/小时) 15 16 16 16 16 18 18 18 18 15 15 15 16 16 14
完成量(小时)
40 40 40 40 50 50 50 50 50 50 80 80 80 80 80 单位成本(元/小时) 15 15 15 16 14 14 15 15 15 16 14 14 14 14 15
最小二乘法的基本原理就是寻一条总的看来离各散点 最近的一条直线,使实际值y 与 相应的理论值 差达到最小。即:
完成量(小时)
第一节 相关分析
相关图
30 广告费(万元) 年销售收入(百万元) 12
33 12
33 12
40 13
56 14
58 14
65 20
72 22
80 26
80 26
90 30
销售收入 (百万
40 30 20 10 0 0 10 20 30 40 50 60 70 80 90 100
元)
广告费(万元)
相 关 系 数 ( coefficient of product – moment
correlation),或 Pearson 相关系数(软件中常用 此名称) 说明相关的密切程度和方向的指标。
r ——样本相关系数
第一节 相关分析
(一)相关系数
2. 简单相关系数的计算
现象间相关的形式特点不同,相关系数的计算方法也不同。 直线相关系数(简称相关系数.)——是对两个变量之间 线性相关程度的度量。
第五章
回归分析
2014-11-19
教学目的与要求
1.
2. 3. 4.
正确理解相关关系的含义、种类及相关分 析的主要内容; 掌握相关关系的测定方法; 掌握回归分析的含义和内容; 掌握一元线性回归分析方法。
一、函数关系与相关关系
(一)函数关系(确定性关系) 函数关系指现象间在数量上存在着确定的、 严格对应的依存关系。 特点:对于某一变量的每一个数值,都有另 一个变量的确定的值与之相对应,并且这种关系 可以用精确的数学函数式表示出来,因此称为函 数关系。
回归分析的特点: 1.回归分析的两个变量是非对等关系; 2.回归分析中,因变量是随机变量,自变量
是可控制变量。
回归分析的内容: 1.确定现象之间相关关系的数学模型; 2.测定数学模型的拟合精度。
回归分析与相关分析的区别
相关分析 1、主要描述两个变 量之间相 关的方向和密切程度 回归分析 确定因变量y 和自变量x之间数量 变动关系的数学表达式,并对因变 量进行预测 变量y 和变量x不是对等关系。
第一节 相关分析
负线性相关
不相关
第二节 一元线性回归分析
一、回归分析的概念与种类
相关分析中的相关系数可以从数量上说明变量之间相关 关系的方向和密切程度。但它不能反映一个变量发生一定数 量的变化时,另一个变量会相应的发生多少变动。为了解决 这个问题,就必须采用回归分析的方法。 回归分析是指对具有相关关系的变量,依据其关系形 态,选择一个合适的数学模型,用来近似的表示变量之间数 量平均变化关系的一种统计方法。 回归分析的内容很多,按分析变量的多少不同,可分为 一元回归分析和多元回归分析;按分析变量的表现形态不 同,可分为线性回归分析与非线性回归分析等。本节只讨论 一元线性回归分析的理论与方法。
2
2
SP SS x SS y n xy x y
或r
n x 2 ( x ) 2 n y 2 ( y ) 2
相关主题