关联性分析
“相关”与“一致”有本质的区别。“相关”可以是不同指 标间的相关,可以正相关,可以负相关,只表示变量间的 联系,而“一致”则是同指标间同方向且基本同值的概念。
讨论3:
有研究者欲研究某药口服量与血药浓度关 系,把口服药物设定为1, 2.5, 5, 7.5, 10, 15, 20, 30等档次,每档各取3只动物(共24只)进行 试验,于服药后1 h抽血检验血药浓度(教材 表99)。在SPSS中作散点图(教材图94), 计算得口服药物量与血药浓度的Pearson相关 系数r=0.979,经假设检验P<0.001,认为口服 药物量与血药浓度呈线性正相关。
Data95.xls
作业:
v
P172 第1、2、3题
图2 删除异常点后的散点图
20
RANK of 患病率
r =0.939 s P< 0.001
10
0 0 10 20
RANK of 碘含量
图3 分别取秩次后的散点图
v 患病率一般不服从正态分布,son积矩相 关系数,应用spearman等级相关系数。
请问: 本例的两个变量各有何特征?可以计 算Pearson相关系数吗?若可以,则计算的 方法与步骤有何不妥吗?计算结果正确 吗?可以推出本例的结论吗?
存在问题:
v
线性相关的条件不满足
即口服剂量是人为取定的,属于非随机变量,不宜作 相关分析。
v
利用Pearson相关系数
分析本例的散点图,可发现散点呈曲线形,而非直线 型,因此即使口服剂量是随机变量也不宜直接作线性相关 分析。
表1 某省不同地区水质碘含量与甲状腺肿患病率
碘含量 患病率 地区 (%) (μg/L) 1 1.0 40.5 2 2.0 37.7 3 2.5 39.0 4 3.5 20.0 5 3.5 22.0 6 4.0 37.4 7 4.4 31.5 8 4.5 15.6 9 4.6 21.0 碘含量 患病率 (μg/L) (%) 7.7 6.3 8.0 7.1 8.0 9.0 8.3 4.0 8.5 4.0 8.5 5.4 8.8 4.7 24.5 0.0
v 样本量少,抽样误差大,不能说是关系密
切。
讨论2:
有研究者欲评价两种量表对某疾病的严重 程度得分的一致性,评分者A用量表1,评分者 B用量表2,对同一批患者(5人)进行了评 分,计算了两次评分的相关系数,结果两者相 关系数非常之高(r=0.866 3),因此认为,两 种量表得分是一致的。
请问: 该研究的目的与设计方法吻合吗? 就本例的设计而言,存在任何不妥吗? 本例可否采用Pearson相关系数进行计 算?计算的结果正确吗?推论正确吗?
你同意上述推理和计算吗?应当如何研 究疗效和剂量的关联性? 独立样本,不能考察关联性和计算关联系数。
电脑实验:
v v v
Pearson积矩相关系数计算 p.155
Data91.sav
Spearman等级相关系数计算 p.159
Data92.sav
多分类资料的关联性分析p163 Data93.sav v 散点图的分层与合并 Data94.sav v 两组率比较的资料作关联性检验的实验
地区 10 11 12 13 14 15 16 17
率病患
50
40
r=0.712 P=0.001
30
20
10
0
-10 0 10 20 30
碘含量
图1 甲状腺肿患病率与碘含量的散点图
率病患
50
40
r=0.927 P< 0.001
30
20
10
0 0 10 20 30
碘含量
r =
c2 c + n
2
=
7 584 . = 0 3538 . 7 584 + 53 .
经c2检验,得P<0.025,按0.05水准,可 以认为三种剂量镇痛有效的总体概率有差别。 研究者认为,既然不同剂量组有不同的阵痛效 果,阵痛效果与剂量必定有关联;其关联的程 度可用列联系数来描述:
实习八:
关联性分析
20071114
目的要求
v 了解相关的种类以及相关分析的基本步骤 v 掌握两连续变量间的相关分析方法 v 掌握分类资料的关联分析方法 v 注意相关分析的解释
讨论1:
对某省不同地区水质的碘含量及其甲状 腺肿的患病率作了调查后得到下表的数据, 计算出Pearson相关系数,得r=0.712,经检 验P =0.001,据此认为甲状腺肿的患病率与水 质的碘含量之间有负相关关系,且关系较密 切。这是否正确?为什么?
对r进行假设检验,P值只能说明两变量有 无直线关系,不表示相关的密切程度。
注意分层资料盲目合并易出假象!当且 仅当分层情形下两变量的关系不会因为合并 而被歪曲时才可考虑合并。
b:无相关
® 相关 d:相关 ® 不相关
c:正相关
®负相关
讨论5:
为研究某镇痛药的镇痛效果与剂量的关 系,研究人员在自愿的原则下,将条件相似 的53名产妇随机分成三组, 分别按三种不同剂 量服用该药,镇痛效果如表119所示。
存在问题:
v
样本量太小(5人), 难以得出有统计学意义的结 论。
查表得知,当样本量只有5时,自由度为3,此时在的 水平要得到有统计学意义的相关系数值的最低界限是 0.878,本例相关系数为0.86,尚未达到有统计学意义的临 界值,原研究者必定是对相关系数未作假设检验而妄下断 论。
v
以“相关”推断“一致”
v
未限定浓度范围
研究者取的剂量范围为1~30,而结论认为口服药物量与 血药浓度呈线性正相关,未限定浓度范围,也是不妥的。 相关分析很重要的一条就是在多大范围作的研究就在多大 范围下结论,因为超过范围很可能结论就不再成立。
讨论4:
为研究糖尿病人血糖水平(mmol/L)与胰岛素水 平(mU/L)之间关系,某研究者在太原市某医院收集 了20名糖尿病人的有关数据,得到r =0.523(双侧 s 0.01<P<0.02);同时又在广州市几家医院收集60例 同 类 型 糖 尿 病 人 数 据 , 得 到 r =0.456 ( 双 侧 s P<0.001)。根据P值的大小,该研究者认为广州市 病人总体的相关更密切。 试对此结论发表你的看法。 若对上题的两个样 本作合并分析,讨论合并时的注意事项。