统计学第四版一元线性回归
9 - 19
计算相关系数
统计学
STATISTICS (第四版)
相关系数的性质
性质1:r 的取值范围是 [-1,1]
|r|=1,为完全相关
r =1,为完全正相关 r =-1,为完全负正相关
r = 0,不存在线性相关关系
-1r<0,为负相关 0<r1,为正相关 |r|越趋于1表示关系越强;|r|越趋于0表示关
➢ 当结果被绘制出来之后,他发现并非每一个子代都与父代 一样,不同的是,尺寸小的豌豆会得到更大的子代,而尺 寸 大 的 豌 豆 却 得 到 较 小 的 子 代 。 Galton 把 这 一 现 象 叫 做 “返祖”(趋向于祖先的某种平均类型),后来又称之为“向 平均回归”。一个总体中在某一时期具有某一极端特征(低 于或高于总体均值)的个体在未来的某一时期将减弱它的极 端性(或者是单个个体或者是整个子代),这一趋势现在被称 作“回归效应”。人们发现它的应用很广,而不仅限于从 一代到下一代豌豆大小问题
系越弱
9 - 20
统计学
STATISTICS (第四版)
相关系数的性质
性质2:r具有对称性。即x与y之间的相关系数和y与x之间 的相关系数相等,即rxy= ryx
性质3:r数值大小与x和y原点及尺度无关,即改变x和y的 数据原点及计量尺度,并不改变r数值大小
性质4:仅仅是x与y之间线性关系的一个度量,它不能用 于描述非线性关系。这意为着, r=0只表示两个 变量之间不存在线性相关关系,并不说明变量之
9-5
统计学
STATISTICS (第四版)
9-6
统计学
STATISTICS (第四版)
9-7
第 9 章 一元线性回归
9.1 变量间的关系
9.1.1 变量间是什么样的关系? 9.1.2 用散点图描述相关关系 9.1.3 用相关系数度量关系强度
统计学
STATISTICS (第四版)
怎样分析变量间的关系?
9 - 12
统计学
STATISTICS (第四版)
相关关系
(correlation)
1. 一 个 变 量 的 取 值 不 能
由另一个变量唯一确
定
y
2. 当变量 x 取某个值时, 变量 y 的取值对应着 一个分布
3. 各 观 测 点 分变量间的关系 9.1.2 用散点图描述相关关系
3. 各观测点落在一条线上
x
9 - 11
统计学
STATISTICS (第四版)
相关关系
(几个例子)
子女的身高与其父母身高的关系
从遗传学角度看,父母身高较高时,其子女的身高一般也比 较高。但实际情况并不完全是这样,因为子女的身高并不完 全是由父母身高一个因素所决定的,还有其他许多因素的影 响
一个人的收入水平同他受教育程度的关系
统计学
STATISTICS (第四版)
学习目标
相关关系的分析 参数的最小二乘估计 回归直线的拟合优度 回归方程的显著性检验 利用回归方程进行预测 用残差证实模型的假定 用 Excel 和SPSS进行回归
9-4
统计学
STATISTICS (第四版)
子代与父代一样吗?
➢ Galton被誉为现代回归和相关技术的创始人。1875年, Galton利用豌豆实验来确定尺寸的遗传规律。他挑选了7组 不同尺寸的豌豆,并说服他在英国不同地区的朋友每一组 种植10粒种子,最后把原始的豌豆种子(父代)与新长的豌 豆种子(子代)进行尺寸比较
统计学
STATISTICS (第四版)
完全正线性相关
正线性相关
9 - 15
散点图
(scatter diagram)
完全负线性相关
负线性相关
非线性相关
不相关
统计学
STATISTICS (第四版)
用散点图描述变量间的关系
(例题分析)
【例9-1】为研究销售收入与广告费用支出之间的关系, 某医药管理部门随机抽取20家药品生产企业,得到它 们的年销售收入和广告费用支出(万元)的数据如下。 绘制散点图描述销售收入与广告费用之间的关系
收入水平相同的人,他们受教育的程度也不可能不同,而受 教育程度相同的人,他们的收入水平也往往不同。因为收入 水平虽然与受教育程度有关系,但它并不是决定收入的惟一 因素,还有职业、工作年限等诸多因素的影响
农作物的单位面积产量与降雨量之间的关系
在一定条件下,降雨量越多,单位面积产量就越高。但产量 并不是由降雨量一个因素决定的,还有施肥量、温度、管理 水平等其他许多因素的影响
统计学 数据分析
(方法与案例)
作者 贾俊平
统计学
STATISTICS (第四版)
统计名言
不要过于教条地对待研究的结果, 尤其当数据的质量受到怀疑时。
——Damodar N.Gujarati
9-2
第 9 章 一元线性回归
9.1 变量间关系的度量 9.2 一元线性回归的估计和检验 9.3 利用回归方程进行预测 9.4 用残差检验模型的假定
建立回归模型时,首先需要弄清楚变量之 间的关系。分析变量之间的关系需要解决 下面的问题
变量之间是否存在关系?
如果存在,它们之间是什么样的关系?
变量之间的关系强度如何?
样本所反映的变量之间的关系能否代表总体 变量之间的关系?
9-9
9.1 变量间的关系 9.1.1 变量间是什么样的关系?
统计学
STATISTICS (第四版)
函数关系
1. 是一一对应的确定关系
2.
设有两个变量 x 和 y ,变量 y 随变量 x 一起变化,并完
y
全依赖于 x ,当变量 x 取某 个数值时, y 依确定的关系 取相应的值,则称 y 是 x 的 函数,记为 y = f (x),其中 x 称为自变量,y 称为因变量
原始数据
9 - 16
统计学
STATISTICS (第四版)
散点图
(销售收入和广告费用的散点图)
9 - 17
9.1 变量间的关系 9.1.3 用相关系数度量关系强度
统计学
STATISTICS (第四版)
相关系数
(correlation coefficient)
1.度量变量之间线性关系强度的一个统计量
若相关系数是根据总体全部数据计算的,称为总体
相关系数,记为
若是根据样本数据计算的,则称为样本相关系数, 简称为相关系数,记为 r
也称为Pearson相关系数 (Pearson’s correlation coefficient)
2.样本相关系数的计算公式
3. r (xx)(yy) (xx)2(yy)2