基础统计预备知识
第四节 净相关分析
1.净相关分析(partial analysis):
即以一个系数值来表示在控制第三类变量以后X 与Y的相关。
2. 基本逻辑:
是以第三类变量尽量分别解释(即消减)X与Y 的方差,然后计算X与Y的剩余方差的相关。这 样,第三类变量的影响受到控制而得以解除。
3.适用于因果分析、阐明分析,但不适合于条 件分析。
(2)多因分析(Multiple causation):
理解多个自变量(X1、X2、X3等)对某个因变量(Y) 共同影响与相互效应。
包括:多元线性回归、Logistic回归、鉴别分析、logit 模型;
(3)多项互关分析(intercorrelations):
简化众多变量之间的相互关系;
(intervening variables)。
2.X通过T而影响Y的意思是:
X变动时引起T变动,而T的变动会引起Y变动。
若控制T使之不变,当X变而Y不变,则T显然是X与Y之 间的关键性环节,即X是通过T才影响Y的。
反之,控制T后,X变Y也变,则证明X不是通过T而影响 Y的,即T是无关紧要的。
第一节 因果分析
3.统计控制:
控制W,使之不变的过程。
通过“分表法”得以实现,即依据前Байду номын сангаас变量的值, 将样本个案分组,然后在每组中分析X与Y的关系, 也就是将原表拆为几个分表再研究各分表的相关 关系。
在统计控制后,研究结果有三种可能:
X与Y的关系消失; X与Y的关系维持原状; X与Y仍有关系,但相关程度弱小了,即各分表中X与Y
预备知识
五、集中趋势的测度:
众数、中位数、平均数;
六、离散程度的测度:
离异比率、四分位差、方差和标准差、 离散系数、标准分;
七、消减误差比例 八、相关测量法:
Lammbda, tau-y, Gamma, dy, r, 相关比率。
预备知识
八、易混淆的概念
1.总体分布、样本分布、抽样分布; 2.标准差和标准误; 3.相关关系与函数关系 ; 4.点估计和区间估计 ; 5.一致性、无偏性、有效性; 6.置信度、置信区间、显著性水平; 7.研究假设和虚无假设; 8.甲种误差和乙种误差; 9.描述统计和推断统计;
第二节 阐明分析
3.控制T后,研究结果可能有三种: (1)完全阐明,即X完全是通过T才影响Y; (2)不能阐明,即X完全不通过T而影响Y; (3)部分阐明,即X部分是通过T而影响Y。
第二节 阐明分析
统计结果
研究结论
R1=R2=0
完全阐明
R1=R2=R
不能阐明
R1、R2不等于0,且R1、部分阐明 R2都小于R
第四节 净相关分析
净相关系数(partial correlation coefficient):
以积矩相关系数(r)为基础,并要求变量间是 直线关系,且所有变量都必须是定距变量。它 属于对称相关测量法的一种。
值域为(-1,1),表示在控制第三类变量后X 与Y相关的程度和方向,其平方具有消减误差比 例意义。
的相关系数不等于0 ;
第一节 因果分析
统计结果
研究结论
R1=R2=0
虚假关系
R1=R2=R
真实关系
R1、R2不等于0,且R1、 部 分 真 实 相
R2都小于R
关
第二节 阐明分析
1.作用:
以事实验证X是通过某些因素(T)对Y产生影响。 又称因果环节分析(causal link), 其中,称第三类变量T为“介入变量”
第三节 条件分析与互动效果
1.作用:
以第三类变量(如C)作为基础来了解X与Y在 不同情况下的关系。又称标明模式。
其中,第三类变量C称为“条件变量”。
2.压抑分析:
指X与Y原本没有关系(或关系很弱),但在标 明了条件以后,X与Y的相关关系强大起来。
3.曲解分析:
指把原来的负(正)相关变为正(负)相关的 分析,所引用的条件变量称曲解变量。
统计检验:如果是随机样本,可用F分布来检验 净相关系数值。
第四节 净相关分析
部 分 净 相 关 系 数 ( semi-partial correlation or
part correlation):
它是从一个变量(X或Y)中消除第三类变量 的效果,然后计算其剩余误差与另一个变量 的相关。
统计推断:
预备知识
九、统计研究者的常见谬误
1. 统计联系与因果关系 2. 事后解释谬误 3. 生态学谬误 4. 还原论谬误 5. 统计检验显著与实际意义显著
思考
自然科学与社会科学在研究方法上的区别; 方法与方法论的联系与区别; 理论、观察、统计之间的关系;
第八章 多变量分析初步
第一节 第二节 第三节 第四节 第五节
因果分析; 阐明分析; 条件分析与互动效果; 净(偏)相关分析; 其他净(偏)相关测量法;
多变量分析
依据研究目的,多变量分析分三大类:
(1)详析分析(Elaboration):
关心两个变量(X、Y)间的关系,引进其他变量(W、 T、C)的目的是为加深了解这两个变量的相关性质。
包括:因果分析、阐明分析、条件分析;
第三节 条件分析与互动效果
4.做法:
依据条件变量的值将样本分组,然后在每组 中(即每种条件下)分析X与Y的关系。 若在各组中,X与Y的关系大致相同,则表示 X与Y的关系具有普遍性; 若X与Y在不同的C组中有不同的关系,则表 示X与Y的关系具有条件性,即C变量产生互动 效果;
如:住户拥挤(X)、家庭冲突(Y)、家庭 规模(C) 。
如果是随机样本,可用F分布来检验净相关系 数值,其逻辑基本上相同于积矩相关系数的 检验。
第五节 其他的净相关测量法
净Gamma系数:
做法:依据控制变量(前置变量或介入变量)的值 将样本分组,然后在每组中计算同序对数Ns和异序 对数Nd,然后把各组(Ns-Nd)的总和除以各组的 (Ns+Nd)的总和。
第一节 因果分析
1.作用:
引入若干前置变量(如W等),鉴定自变量 (X)与因变量(Y)之间是否确实有因果关系,
这种关系是虚假的(spurious),还是可能是 真实的(nonspurious)。
又称辩明模式(explanation model)。
2.做法:
引入第三类变量(称为“前置变 量”antecedent variable) 。