当前位置:文档之家› 统计学第六章 相关分析

统计学第六章 相关分析


第一节 相关分析的意义和任务 联系与相互影响是普遍的现象
事物相互间关系的质的解释:
自然的、社会的、经济的、心理的… 事物相互间关系的量的分析:
受教 工作 预防 疾病 两变量或多变量间的数量关系。 育的 后的 疾病 的发 水平 收入 支出 病率
问题的提出:
确定性关系 出租汽车费用与行驶里程: 函数关系 总费用=行驶里程 每公里单价
4、按相关关系情况分
单向因果关系:两个变量之间,只能是自变量X值决 定或影响因变量Y值,而不能是因变量Y 决定或影响
自变量X。
•如父母的身高影响孩子的身高 互为因果关系:两变量之间,自变量X与因变量Y相 关,且互相影响对方,均可被定为自变量 •如物价变动与工资变动
5、根据相关密切程度分
完全相关:两种现象中一个现象的数量变化,另一
3
4 4 5 5 6 6 6
520
640 740 600 800 700 760 900
x 60 x 5(年) y 8520 y 710(元) n 12 n 12
11 12
合计
8 9
60
840 1080
8520
首先,判断每个相关点是正相关,负相关还是零相 如果 时,对应 ,, 说明这个点属于正相关 说明这个点属于正相 如果 或 时, y y (x x)( y y ) 的乘积为正数,为负数 x x y ( x x )( y y ) 0 x y y x x 所以,根据 如果 时,对应 , 说明这个点属于负 x x yy y 关,以两个平均值为标准来判断 如果 时 , 对应 , 说明这个点属于 x x y 或为零,可以判断各相关点是属于正相关、负相关 说明这个点属于零相关。 。此时 关。此时 为正数。 也为正数。 ( x( xx )( xy )( y y)y y ) 相关。此时 为负数。 ( x x )( y ) 或零相关。 负相关。此时 ( x x)( y y) 也为负数。
的规律,总有唯一确定的值与之对应。
函数关系可以用数学表达式来反映 函数关系的例子:

圆的面积(S)与半径之间的关系可表示为:
S R
2
显著一 一
对应关 系
(二)随机性的相关关系:
不存在一一
对应的依存关系。
变量间确实存在、但数量上不固定的相互
依存关系。这种关系不能用函数关系精确表达;
即变量 x 取某个值时,与之相关的变量 y 的取值可能有若干个(一个变量的取值不能由另
家庭编号
月收入
单位:元
1
2500
2
1500 1200
3
3000 2800
4
6200 4200
5
8800 6000
6
2000 1800
7
9200 6500
8
9
10
7500 5300
4000 1800 3600 1500
消费支出 2000
排列整理后的相关表:
月收入 消费支出 1500 1200 1800 1500 2000 1800 2500 2000 3000 2800 4000 3600 6200 7500 8800 4200 5300 6000 9200 6500
可见,随着家庭月收入的提高,居民的消费支 出也有相应提高的趋势,两者之间存在明显的正相关
关系。
(二)相关图(也称散点图)
一般以直角坐标系的横轴代表变量X,纵轴代表
变量Y,将两个变量间相对应的变量值用坐标点的形
式描绘出来,用来反映两变量之间相关关系的图形。
消 费 支 出
7000 6000 5000 4000 3000 2000 1000 0 0 2000 4000 6000 8000 10000
因变量数列的标准差
自变量数列的标准差
对协方差的理解
协方差:两个变量与其均值离差乘 积的平均数,是相互关系的一种度量。
(x x )(y y ) 1 (x x )(y y ) n n
σ
2 xy
序号 1 2
机床使用 年限X
2 2
年维修费 Y
400 540
3
4 5 6 7 8 9 10
0
为正
2
4
6
为负 8
10
x5
其次,根据离差乘积总和
会有几种情况出现:
( x x)( y y)
判断两现象属于哪一种相关形式。
1、所有点全是正相关,则加总的结果为正数。
2、所有点全是负相关,则加总的结果为负数。
3、所有的点既有正相关,又有负相关(也可以由 零相关)。加总的结果正数和负数会发生抵消。抵 消的结果如为正数,则为正相关,如为负数,则为 负相关。
因素。对于这些横截面比较中的不可比问题,在分析
和比较时应做相应的剔除。另外,在观察历史情况的 变化时要注意,恩格尔系数反映的是一种长期的趋势, 而不是逐年下降的绝对倾向。它是在熨平短期的波动 中求得长期的趋势。
一、函数关系与相关关系的概念
(一)确定性的函数关系: ;另一种是相关关系。
客观现象总是普遍联系和相互依存的。它们之间
二、相关关系的种类

按影响因素多少分: 单相关:两个变量间相关
复相关(多重相关、和偏相关)

按表现形态分: 直线相关
曲线相关

按相关关系的方向分: 正相关
负相关

按相关密切程度分:
完全相关 不完全相关 不相关 单向依存关系 互为因果关系

按变量之间的依存关系分:
1、按相关关系涉及的因素(自变量)多少分为: 单相关:(也称一元相关)两变量之间的相关关系
家庭月收入
二、相关系数的测定
相关系数 :在直线相关条件下,说明两个变量 之间相互关系密切程度的统计指标。若相关系数是 根据总体全部数据计算的,称为总体相关系数,用
(一)相关系数测定——积差法
r x y
2 xy
;如是根据样本数据计算的,则称为样本相关系
数, 用 公式:
r
自变量数列和因变量数列的协方差
现象的数量变化而确定。即函数关系

如S = R2
函数关系是相关关系的一个特例
不相关:两种现象的数量各自独立,互不影响。
如家庭收入多少与孩子多少之间不存在相关关系
•股票价格的高低与气温的高低是不相关的。
4 Y 2
0
-2
-4 -4 -2 0 2
X 4
不完全相关:两种现象之间的关系,介于完全相关
一个变量惟一地确定)
相关关系的例子:
现象不存在 间一一对应 原材料消耗额与产量、单位产品消耗、与产量 的依存关系 价格之间的的关系
商品销售额(y)与广告费支出(x)之间的关系
粮食亩产量 (y) 与施肥量 (x1) 、降雨量 (x2) 、 温度(x3)之间的关系 收入水平(y)与受教育程度之间的关系(x) 父亲身高(y)与子女身高(x)之间的关系 投资额与国民收入的关系等等都属于相关关系 ……
恩格尔定律是根据经验数据提出的,它 恩格尔系数是根据恩格尔定律得出的比例数, 是在假定其他一切变量都是常数的前提下才 是表示生活水平高低的一个指标。其计算公式如 适用的,因此在考察食物支出在收入中所占 下: 比例的变动问题时,还应当考虑城市化程度、 食物支出金额 食品加工、饮食业和食物本身结构变化等因 恩格尔系数=─────── 素都会影响家庭的食物支出增加。只有达到 总支出金额 相当高的平均食物消费水平时,收入的进一 除食物支出外,衣着、住房、日用必需品等 步增加才不对食物支出发生重要的影响。 的支出,也同样在不断增长的家庭收入或总支出
再次,从离差乘积总和中消除项数多少的 影响。
离差乘积总和 ( x x)( y y) 受项数多少的影响 。项数多,数值可能大;项数少,数值可能小。
最后,从协方差中消除消除变量值大小和 离差值大小的影响
协方差是用绝对数表现的平均值。其数值大小和
变量值本身数值的大小有关系。也就是和离差数值大
第八章
相关分析与回归分析
相关分析的意义和任务 简单线性相关分析 回归分析 估计标准误差
第一节
※ 第二节 ※ 第三节
第四节
学习目的与要求
学习目的:通过本章学习,了解现象的 相关关系以及相关与回归的关系。掌握 相关系数的计算方法,掌握一元线性回 归分析,了解常规曲线分析的基本方法。 学习要求:课前预习,课后复习,上课 认真听讲,有疑问随时提出,及时完成 课后练习。
1200 1000 800 600
相关图中的两 条线代表平均 线,由这两条 线,即可对于 每个点作出判 断。
Ⅳ ( x x )( y y )Ⅰ( x x )( y y )
为负 为正
y 710
400 200 0
Ⅲ ( x x )( y y )Ⅱ ( x x )( y y )
正线性相关
三、相关分析的主要内容
(一)确定现象之间有无关系及相关关系的表现形式 (二)确定相关关系的密切程度 1、 定性认识:受判断者的经验、学识、能力等
因素的影响
2、 编制相关表和相关图 (三)选择合适的数学模型 (四)测定变量估计值的可靠程度 (五)对相关系数进行假设检验
第二节 简单线性相关分析 一、相关图和相关表
非确定性关系 相关关系 家庭收入与恩格尔系数: 家庭收入高,则恩格尔系数低。
G KP
19世纪德国统计学家恩格尔根据统计资料,对消
费结构的变化得出一个规律: 一个家庭收入越少,家庭收入中(或总支出中) 用来购买食物的支出所占的比例就越大,随着家庭收 入的增加,家庭收入中(或总支出中)用来购买食物
3、按相关方向分为:
正相关:两个变量的变动方向大体上相同时,即
相关主题