第十六章变量分析的逻辑和策略一、单项选择题变量X与变量Y之间的相关系数等于0.6,说明()。
(中财2011年研)A.X变化解释了Y变化中的46%B.Y变化解释了X变化中的60%C.X变化解释了Y变化中的60%D.X和Y的协方差比例为46%【答案】C二、概念题1.外在变量(北大2002年研)答:两变量间的虚假关系是指两变量表面是一个非对称关系,但实际上是一个对称关系,两变量间并无有意义的或内在的联系,它们之所以有关系是因为此两变量恰巧与其他某一变量相关联。
造成两变量虚假关系的这“某一变量”即称为外在变量,它与自变量及因变量的关系用图来表示就是:2.累积作用(浙大2007年研)答:累积作用是指两个自变量对因变量Y的共同作用,这种共同作用并不一定是两个自变量各自影响力的单纯相加,决定其强度的因素很多,但其中以两自变量间的相关程度为最重要。
累积作用的大小的主要决定因素是两自变量间的相关程度。
3.交互分类(北科大2010年研)答:交互分类是一种专门用来分析两个定类变量(或一个定类变量,一个定序变量)之间关系的统计分析方法。
它是将研究所得的一组数据按照两个不同的变量进行综合的分类,其结果通常以交互分类表(又称为列联表)的形式反映出来。
三、论述题试论述详析模式的方法和主要作用。
(北大2002年研)答:(1)方法①两变量的交互分类a.资料分析的第一步是检验假说所预言的关系是否存在,即对这种关系的有无和强弱以及它的状况进行描述,它回答社会现象“是什么”的问题。
对两变量间关系进行描述的最基本的方法是“交互分类法”,又称列联表。
这种描述性分析能在统计上指出两变量间关系的有无和大小。
但仍不能回答假设所预言的两变量间的关系是否真实存在的问题。
b.分析的第二步任务是要对变量之间的关系和联系程度进行精确的因果分析,以判别关系的真伪,回答这种关系为什么会产生以及说明这种关系存在的条件。
为了解释和检验两变量间的真实关系,虽然可以根据已有的知识作出猜测,但更有价值的办法是进行系统的检查。
②引入检验因素检验两个变量间关系的最重要、最系统的办法是引入第三个变量,然后检查引入第三个变量后自变量与因变量原有关系的变化情况,由此澄清与深化对原关系的认识,并揭示两变量的真实关系。
这种引入第三变量对两变量关系进行检验,以解释或确定这种关系的过程称为分析的详析化,被引入的变量称为检验因素或控制变量。
检验的过程运用的“分表法”,具体来说为:a.首先描述变量X与Y的关系,这时的关系称为原关系。
b.依据理论或经验选择检验因素。
c.将检验因素分成不同层次或不同类别,然后在每一类别中做X与Y的分列联表,分表中X与Y的关系称为部分关系。
d.对各分表中X与Y的关系(即部分关系)进行考察,若X与Y的原关系在各分表中均消失了(即各分表中X与Y均无关),证明原关系主要由检验因素引起;若X与Y间的原关系在各分表中仍然存在(即各分表中X与Y的关系与原表相近),说明X与Y的关系不受检验因素的影响;若X与Y间的原关系在各分表中存在但较原关系减弱,证明X与Y间的关系部分受到检验因素的影响。
(2)主要作用①详析模式的主要作用之一是使调查研究可分享实验设计的一些优点。
详析模式是一种近似的实验设计。
无疑所控制的项目越多,则两个群体除一个变量不同外,其余可能越接近相同。
这样,详析模式就使调查近似于事后实验设计,从而成为社会科学中最有力的证明模式之一。
②详析模式主要作用之二是可以充分利用统计调查资料,并将研究引向深入,它一方面能对变量关系作出描述;另一方面通过引入第三变量,它还可以澄清事实真相,包括两变量间关系的真伪、这一关系存在的条件和存在的原因等等,从而使变量间的关系更具体、更精确可靠。
分析的目的在于解释,详析模式在解释上的贡献很大,它不仅能证实解释,也能排除错误的解释,并能获得新的解释等。
因此它是建立理论和开发资料的有力工具。
在详析模式中,部分关系与原关系进行比较时,可出现三种情况:关系相同;关系减小或消失;关系分裂,即一些部分关系与原关系相似或加强,而另一些部分关系则有所减弱或完全消失。
关系相同和关系相同是一般关系分析的主题,而关系分裂是条件关系分析的主题。
2.请谈谈相关分析与因果分析的区别与联系。
(中南财大2010年研)答:(1)相关分析与因果分析的含义①相关分析相关是指两个变量间存在一种连带关系,即当一个变量的值发生变化时,另一个变量的值也相应地发生变化。
相关分析就是以一个统计值表示变量与变量间的关系,这个统计值称为相关系数。
通常大多数相关系数取值在0与±1之间,0代表无相关,±1代表完全相关,相关系数越大,表示相关程度越强。
相关系数前面的正负号表明相关的方向,正相关系数表示,当一个变量的值增大时,另一个变量的值也增大;而负相关系数则表示,当一个变量的值增加时,另一个变量的值却在减少。
②因果关系,是指某个因素的存在一定会导致某个特定结果的产生。
因果分析是为了确定引起某一现象变化原因的分析,主要解决“为什么”的问题。
因果分析就是在研究对象的先行情况中,把作为它的原因的现象与其他非原因的现象区别开来,或者是在研究对象的后行情况中,把作为它的结果的现象与其他的现象区别开来。
回归分析是一种因果分析,它是根据两变量间关系的具体形态,选择一个合适的数学模型,用来近似地表达变量间平均变化关系,这个数学模型就是回归模型。
(2)相关分析与因果分析的区别①相关分析的目的在于了解两个变量之间的关系强度,即用相关系数来描述x和y两个变量之间的共变特征。
因果分析的目的在于了解一个变量怎样随另一个变量变化而变化。
②相关分析中,两个变量之间的关系是双向的,不涉及两个变量间的因果关系。
也就是说回归分析可以不分自变量和因变量。
因果分析表示一种因果关系,可以进行预测,必须明确自变量和因变量。
(3)相关分析与因果分析的联系①因果分析以相关分析为基础,只有两个变量之间存在高度的相关关系时,因果分析才有意义。
②一般先进行相关分析,测定现象之间的相关程度大小,进而决定是否进行因果分析,推断出变量之间的因果关系。
第十七章多元分析概论一、概念题1.偏相关答:偏相关是指用一个统计值来测量当控制了其它变量的影响后,某一变量与另一变量间关系的有无和大小。
偏相关分析要求所有变量均为定距变量,测量偏相关关系的统计值称为偏相关系数,其值由-1到+1。
2.回归分析(东北财大2008年研)答:回归分析是指对有相关关系的现象,根据其关系的形态找出一个合适的数学模型,即建立回归方程,来近似地表达变量间的平均变化关系,以便依据回归方程对未知的情况进行估计和预测的方法。
回归分析的对象是定距层次的变量,它的中心问题是建立回归方程,而建立回归方程的基础是最小二乘法。
在运用回归分析进行预测时,应注意两点:①要注意时间条件,即回归方程往往反映的是一定时期内变量间的相互关系,当时期不同时,这种关系常常会发生变化;②要注意预测不能超出资料所适合的范围,即回归方程的预测在变量取值上有一定的临界条件,忽视这一点,有时也会作出不合理的预测来。
3.多元回归分析答:要解决用多个自变量来估计或预测一个因变量的数值,以及弄清不同的自变量对因变量所实际具有的影响力大小这两个方面的问题,需要采用多元回归分析的方法。
二、简答题1.简述多元分析的类型答:(1)美国学者库利和洛内斯按照变量的组数和群体数分为四类:因素分析,复相关、偏相关和典型相关;多因方差分析;判别分析和聚类分析。
(2)英国统计学家根据研究目的将多元分析方法分为两大类:相依性分析和互相依性分析。
①回归分析、判别分析、典型相关分析均属于相依性分析,它们的共同特点是分析所涉及的变量是不平等的,即有自变量与因变量之分。
相依分析的目的在于分析多个变量对某个或某些变量的共同影响或相对效应。
②互相依性分析所涉及的变量是平等的,分析的目的是变量之间的相互关系,以简化这种相互关系。
因素分析、聚类分析等均属于互相依性分析。
每一种多元分析方法都是建立在一系列假设前提的基础之上的,这些假设既包括这一方法所涉及的变量的测量层次,也包括这些变量间相互关系的性质,以及资料的不同来源等。
在选择一种多元分析方法时,应首先考察这一方法所要求的前提条件是否得到满足,若某些条件未获得满足,就要想办法进行某种统计处理。
2.简述互相依性分析常用的方法。
答:互相依性分析的目的是研究多个变量之间的相互关系,从中找出一个简单的结构。
互相依性分析中常用到的方法主要包括:(1)聚类分析聚类分析是一种分类技术,它是依据研究者的理论或对变量的实际相关情况将变量分类(组),然后测量这一分类方式是否有效。
聚类分析适合于各种测量层次的变量。
根据聚类的准则,聚类分析可分为两类:①距离法。
距离法是通过变量间的距离度量变量的相似性的,距离愈短,相似性越佳,愈可合并为一类。
②相关系数法。
相关系数法是通过变量间的相关系数来度量聚类中变量的相似性的,相关系数越大,相似性越佳,越可合并为一类。
(2)因素分析因素分析是旨在简化大量变量之间的关系的方法,是从众多的相关变量中抽取若干共同因子。
因素分析的主要步骤包括:抽取共同因子、旋转因子轴并对抽出的因子进行解释、计算样本单位的因子得分。
(3)最小空间分析最小空间分析是一种较新但极有发展潜力的分析方法,可适用于各种尺度的变量,最小空间分析以相关系数为基础,通过绘图的方法来简化多个变量之间的相互关系。
最小空间分析是要找出一个最小而又最能代表实际情况的空间达到简化变量关系的目的。
三、论述题1.请谈谈相关分析与因果分析的区别与联系。
(中南财经政法大学2010年研)答:(1)相关分析与因果分析的含义①相关分析相关是指两个变量间存在一种连带关系,即当一个变量的值发生变化时,另一个变量的值也相应地发生变化。
相关分析就是以一个统计值表示变量与变量间的关系,这个统计值称为相关系数。
通常大多数相关系数取值在0与±1之间,0代表无相关,±1代表完全相关,相关系数越大,表示相关程度越强。
相关系数前面的正负号表明相关的方向,正相关系数表示,当一个变量的值增大时,另一个变量的值也增大;而负相关系数则表示,当一个变量的值增加时,另一个变量的值却在减少。
②因果关系,是指某个因素的存在一定会导致某个特定结果的产生。
因果分析是为了确定引起某一现象变化原因的分析,主要解决“为什么”的问题。
因果分析就是在研究对象的先行情况中,把作为它的原因的现象与其他非原因的现象区别开来,或者是在研究对象的后行情况中,把作为它的结果的现象与其他的现象区别开来。
回归分析是一种因果分析,它是根据两变量间关系的具体形态,选择一个合适的数学模型,用来近似地表达变量间平均变化关系,这个数学模型就是回归模型。