当前位置:文档之家› 第九章 相关与回归分析

第九章 相关与回归分析

第9章相关与回归分析【教学内容】相关分析与回归分析是两种既有区别又有联系的统计分析方法。

本章阐述了相关关系的概念与特点;相关关系与函数关系的区别与联系;相关关系的种类;相关关系的测定方法(直线相关系数的含义、计算方法与运用);回归分析的概念与特点;回归直线方程的求解及其精确度的评价;估计标准误差的计算。

【教学目标】1、了解相关与回归分析的概念、特点和相关分析与回归分析的区别与联系;2、掌握相关分析的定性和定量分析方法;3、掌握回归模型的拟合方法、对回归方程拟合精度的测定和评价的方法。

【教学重、难点】1、相关分析与回归分析的概念、特点、区别与联系;2、相关与回归分析的有关计算公式和应用条件。

第一节相关分析的一般问题一、相关关系的概念与特点(一)相关关系的概念在自然界与人类社会中,许多现象之间是相互联系、相互制约的,表现在数量上也存在着一定的联系。

这种数量上的联系和关系究其实质,可以概括为两种不同类型,即函数关系与相关关系。

相关关系:是指现象之间客观存在的,在数量变化上受随机因素的影响,非确定性的相互依存关系。

例如,商品销售额与流通费用率之间的关系就是一种相关关系。

(二)相关关系的特点1、相关关系表现为数量相互依存关系。

2、相关关系在数量上表现为非确定性的相互依存关系。

二、相关关系的种类1、相关关系按变量的多少,可分为单相关和复相关2、相关关系从表现形态上划分,可分为直线相关和曲线相关3、相关关系从变动方向上划分,可分为正相关和负相关4、按相关的密切程度分,可分为完全相关、不完全相关和不相关三、相关分析的内容相关分析是对客观社会经济现象间存在的相关关系进行分析研究的一种统计方法。

其目的在于对现象间所存在的依存关系及其所表现出的规律性进行数量上的推断和认识,以便为回归分析提供依据。

相关分析的内容和程序是:(1)判别现象间有无相关关系(2)判定相关关系的表现形态和密切程度第二节相关关系的判断与分析一、相关关系的一般判断(一)定性分析对现象进行定性分析,就是根据现象之间的本质联系和质的规定性,运用理论知识、专业知识、实际经验来进行判断和分析。

例如,根据经济理论来判断居民的货币收入与社会商品购买力是否存在相关关系;根据会计学理论来判断生产成本与利润有无相关关系;根据生物遗传理论来判断父辈的身高与子辈的身高是否存在相关关系等。

定性分析是进行相关分析的基础,在此基础上,根据需要通过编制相关表和绘制相关图来进行分析。

(二)相关表相关表就是把被研究现象的观察值对应排列所形成的统计表格,如某地区工业固定资产投资与工业增加值的历史资料对应排列所形成的表9-1。

表9-1 某地区工业固定资产投资与工业增加值相关表单变量分组相关表是在具有相关关系的两个变量中,只对自变量进行分组的相关表(见表9-2)。

表9-2 商品销售额与流通费用率相关表双变量分组相关表就是对自变量和因变量都进行分组的相关表。

如果两个相关变量变动均较为复杂,根据分析的需要,同时对两个变量进行分组,即对总体作复合分组,一个分组设在主体栏,另一个分组设在叙述栏,形成棋盘式的表格,叫双变量分组相关表(见表9-3)。

表9-3 化肥施用量与稻谷单产量双变量分组相关表(三)相关图相关图也叫相关散点图,它是根据相关表中的观测数据在坐标图中所绘制的点状图形。

用x和y分别代表两个变量,把相关表中的对应观测值一一描绘在坐标图中,则形成了反映相关点分布状况的图形,据此就可以观测现象间相关关系的情况(如根据表9-1的数据所绘制的图9-1和根据表9-2的数据所绘制的图9-2)。

图9-1 工业固定资产投资与工业增加值相关图(三)相关图在相关图中,若相关点呈现出一定的规律性,如大致为一条直线(如图9-1所示)或一条曲线(如图9-2所示),这表明现象间存在相关关系,且为直线相关或曲线相关。

相关点越密集,表明相关关系越密切。

若相关点分布毫无规律,则表明现象间无相关关系或存在低度的相关关系。

图9-2 商品销售额与流通费用率相关图二、相关关系的定量分析(一)相关系数的含义相关系数是指直线相关条件下,说明两种现象之间相关关系密切程度和方向的统计分析指标,用r表示。

其定义公式为:依直线相关系数的定义公式可知相关系数的含义如下:1.r的取值范围为-1≤r≤1。

2.r的绝对值越接近于1,表明相关关系越密切;越接近于0,表明相关关系越不密切。

3.r=+1或r=-1,表明两种现象完全相关,即存在函数关系。

4.r=0,表明两种现象无直线相关关系。

5.r>0,表明现象呈正直线相关;r<0,表明现象呈负直线相关。

(二)相关系数的计算1.根据相关系数的定义公式可直接计算相关系数。

[例9-1]已知某地生产总值和社会商品零售总额的历史资料见表9-4。

表9-4 某地生产总值和社会商品零售总额资料单位:亿元现根据表9-4的资料,用定义公式计算相关系数,其计算过程数据列于表9-5中。

表9-5 相关系数计算表(一)2.相关系数的简捷计算法。

按照定义公式计算相关系数r运算量较大,过程烦琐,实践中多采用由定义公式推导出的简捷公式计算相关系数。

简捷计算公式为:按照这一公式计算相关系数,只需列3个计算栏:xy、x2、y2,且避免了平均数、协方差、标准差的直接计算,大大简化了运算过程。

现根据表9-4中的数据,用简捷公式计算相关系数(见表9-6)。

表9-6 相关系数计算表(二)3.相关系数的其他计算公式。

在[公式9-1]中,分子、分母中均有1/n,因此可以消掉,于是可得:根据相关系数的定义公式,可推导出相关系数的其他计算公式:根据掌握的有关统计资料,可灵活选择合适的公式计算相关系数,以达到简单易行的目的。

第三节回归分析的一般问题一、回归分析的概念与特点(一)回归分析的概念“回归”一词是英国生物学家高尔顿(Francis Galton, 1822—1911)首先提出的。

高尔顿在研究父母身高和子女身高的关系时发现:身材特别高的父母所生的孩子其身材并非特别高,而身材特别矮的父母所生孩子的身材也并非特别矮,子辈身高有向父辈平均身高逼近的趋向,他把这种现象叫作“身高数值从一极端至另一极端的回归”。

后来,高尔顿的学生皮尔逊(Karl Pearson,1857—1936)把回归的概念同数学的方法联系起来,把代表现象之间一般数量关系的统计模型叫作回归直线或回归曲线,从此诞生了统计上著名的回归理论。

此后,“回归”这个词被用来泛指变量之间的一般数量关系。

现象之间的相关关系,虽然不是严格的函数关系,但现象之间的一般关系值,可以通过函数关系的近似表达式来反映,这种表达式根据相关现象的实际对应资料,运用数学的方法来建立,这类数学方法称回归分析。

(二)回归分析的特点与相关分析相比,回归分析的特点有:1.回归分析的两个变量是非对等关系。

2.回归分析中,因变量是随机变量,自变量是可控制变量。

0二、回归分析的内容回归分析是指将具有相关关系的现象的变量转变为函数关系,并建立变量关系的数学表达式,来研究变量之间数量变动关系的统计分析方法。

具体内容包括两个方面: (一)确定现象之间相关关系的数学模型(二)测定数学模型的拟合精度三、相关分析和回归分析的区别与联系相关分析与回归分析既相互区别又密切联系,是相辅相成的。

相关分析是研究两个或两个以上变量之间相关关系及其密切程度的分析。

判断相关关系及其密切程度,一般可通过进行定性与定量分析、编制相关图表、计算相关系数等,来反映相关方向和密切程度。

回归分析是指将相关现象的关系转变为函数关系,并建立变量关系的数学表达式,来研究变量之间数量变动关系的统计分析方法。

相关分析和回归分析是研究现象之间相互依存关系的不可分割的两个方面。

一般先进行相关分析,测定相关现象之间相关程度的大小,进而决定是否需要进行回归分析,并拟合相应的回归方程,以便进行推算和预测等,因而可以说相关分析是进行回归分析的基础,回归分析是把变量的相关关系转变为函数关系的手段,是相关分析的继续和深入。

但需指出,相关分析可以不分自变量和因变量,而进行回归分析时,则必须明确自变量和因变量,当自变量与因变量位置互换时所得到的回归方程则不同。

第四节一元线性回归模型的建立与检测一、一元线性回归模型(一)构建回归模型应具备的条件1.现象间确实存在数量上的相互依存关系。

2.现象间存在直线相关关系。

3.具备一定数量的变量观测值。

(二)回归直线方程的求法回归直线方程又称一元一次线性回归方程,若以x表示自变量,y表示因变量,则其基本形式为:y=a+bx[例9-2]几个地区的工农业增加值和财政收入资料见表9-7。

表9-7 几个地区的工农业增加值和财政收入资料二、估计标准误差(一)估计标准误差的概念与计算估计标准误差是用来说明回归直线方程代表性大小的统计分析指标。

其定义公式为:按照定义公式计算估计标准误差十分烦琐,运算量较大,因为它需要计算出因变量y所有的估计值。

在实践中,在已知回归直线方程的情况下,通常用下面的简捷公式计算估计标准误差:下面根据[例9-2]的资料分别用定义公式和简捷公式计算比较估计标准误差(见表9-8)。

表9-8 估计标准误差计算表(二)估计标准误差与相关系数的关系估计标准误差与相关系数存在着密切的关系,二者的关系可由如下表达式描述:根号前面的正负号表明正相关或负相关,具体取舍由回归系数的符号来确定:回归系数为正,则取正;回归系数为负,则取负。

在给定相关系数的情况下,估计标准误差的计算公式为:(三)相关系数与回归系数的关系相关系数与回归系数的关系可用如下公式表示:(四)回归方程的变形形式在y=a+bx 中,b 是直线的斜率。

由于回归直线方程必经过)(y x ,点,根据点斜式直线方程的公式,回归直线方程可由下式给出:[例9-3]某银行各月存款平均增加额165=x 亿元,各月放款平均增加额124=y 亿元。

又知各月存款、放款增加额的标准差分别为σx=5亿元、σy=4亿元。

存款、放款增加额两个变量的相关系数r=0.8,试求放款增加额y 与存款增加额x 的回归直线方程及估计标准误差。

三、应用相关分析与回归分析应注意的问题相关分析与回归分析都是重要的统计分析方法,在统计学知识体系中占有重要的地位。

它们对于人们加深现象间相互依存关系的认识,促使这种认识由定性阶段进入定量阶段都具有重要意义。

但是,应该看到,相关分析和回归分析与其他统计方法一样,也有自己的局限性,因此,在实践中应注意如下几方面的问题:(一)注意定性分析与定量分析的结合(二)注意客观现象质的规定性(三)注意社会经济现象的复杂性(四)注意对相关系数和回归直线方程的有效性进行检验11。

相关主题