如何正确选择统计方法
爆发波个数 0.54±0.10 1.06±0.34 1.42±0.47 1.40±0.25
2.6 误用配对设计资料的t检验 处理单因素k(k>3)水平设计的资料
辨析:
❖没有交待将大鼠按体重等重要的非实验因素作为配伍条件进行随机区组。 ❖本资料有四个剂量,属于单因素四水平设计的定量资料,不可以用成组设计或配对设计的t检验。 ❖措施:如果满足正态性和方差齐性两个前提条件,应用单因素四水平设计定量资料的方差分析,在得
如何正确选择统计方法
资料类型 设计方案 实验分组 检验条件
资
料 数据 类 特征
型
单组 设计
表1 单变量资料差异比较的分析方法小结
完全随机设计
配对或配伍设计
ቤተ መጻሕፍቲ ባይዱ两组
多组
两组
多组
正态、方差 样本与总体均
定齐
数比较的t检验 两样本t检验
量
资 料 非正态和/ Wilcoxon符号
或方差不齐 秩和检验
t’ 检验、Wilcoxon 秩和检验
结合本资料可见冠状动脉硬化等级有随年龄增高而增加的趋势。
问:处理此资料所用的统计分析方法以及所得出的结论有何不妥之处?
3.3 误用χ2检验回答相关性问题
辨析1:
◈本资料为“双向有序且属性不同的二维列联表资料”,处理这种资料有3个目的,因此,就对应着3套不 同的统计分析方法。
➢分析不同年龄组患者冠状动脉硬化等级之间有无差别:看作单向有序资料,选用秩 和检验。
0.85+0.56△▲ 1.26+0.75△▲ 0.51+0.32△▲ 1.41+0.65△▲ 1.11+0.41△▲ 0.50+0.49△▲ 0.59+0.56△▲ 6.87+3.08△▲
1.98+0.72 2.11+0.73 1.91+0.41 2.29+0.62 1.92+0.42 1.62+0.62 1.79+0.59 15.98+2.98
出有统计学意义的结论后,还可进一步采用Dunnett t检验或LSD检验。
❖如果在专业上有必要对3项指标同时进行考察,还应选用该设计的定量资料的三元方差分析对资料进行 处理。
三、计数资料分析方法的常见问题
3.1 计算相对数时分母太小 3.2 误用χ2 检验分析结果变量为有序变量的资料 3.3 误用χ2检验回答相关性问题
➢分析年龄与冠脉硬化等级间有无相关关系:选用等级相关。 ➢分析两者间是否存在线性变化趋势则应用线性趋势检验。
◈作者欲考察“两个有序变量之间是否呈相关关系”,而χ2检验结果是P<0.05,说明冠状动脉硬化患者
在不同年龄组的人数分布是不同的。
◈事实上,若将表中任何两行的频数互换或将任何两列的频数互换,所得的χ2检验的统计量数值是不会 变化的,说明χ2检验用于处理有序变量形成的二维列联表资料是不合适的。
R×C表χ2检验,χ2=53.33 ,P <0.01 ,认为两组疗效之间的差异有统计学意义。
确切的统计量P值。
辨析: u 本资料属于单项有序的R×C表,临床疗效有等级之分,对于等级资料可采用Ridit分析或秩和检验。而不
应用R×C的χ2检验,R×C表χ2 检验只能检验两组内部构成是否相同或频数的分布是否相同,不能检验 疗效有无差别。不难看出,若对表4资料任意两列数字进行对换,可以清楚地发现,χ2值仍为53.33,不会
剂量(g/kg) 0 2.5 5.0 7.5
表 莪术水煎剂对大鼠子宫肌电活动的影响(均数±标准差)
峰面积(mW·ms) 142.65±34.64 337.74±250.91 449.50±154.45 651.08±98.20
持续时间(s) 3.50±1.32 8.82±2.78 9.82±2.89 13.07±1.88
3.4 多值有序变量的高维列联表资料
3.5 不满足连续性χ2检验条件时未做校正 3.6 十一种形式的列联表
3.7 误用χ2检验取代Fisher精确检验
3.8 对R×C表直接分割进行两两比较
3.1 计算相对数时分母太小
文题:疏肝利胆中药防治胆固醇结石形成的实验研究。实验数据见表4。请问:在表达资料方面有何 不妥之处?
表2 双变量(多变量)资料的关联性分析方法小结
数据特征
相 定量资料
x、y服从双变量正态分布 x、y不服从双变量正态分布
关 双向无序
分
析
定性资料( 表) 双向有序、属性不同 RC
双向有序、属性相同
回 应变量为连续型定量变量,服从正态分布 归
分 应变量为定性变量 析 应变量为含有截尾数据的生存时间
分析方法 pearson直线相关分析 Spearman秩相关 2检验,计算列联系数 Spearman秩相关、线性趋势检验 一致性检验(kappa系数的假设检验) 一个应变量,一个自变量:直线回归分析 一个应变量,多个自变量:多重线性回归分析 Logistic回归分析 Cox比例风险回归分析
二、计量资料分析常见的统计问题
2.1 忽视t检验的前提条件 2.2 误用成组设计资料的t检验分析配对设计资料 2.3 忽视方差分析的前提条件 2.4 误用t检验分析等级资料 2.5 误用t检验处理重复测量的两因素试验设计 2.6 误用配对设计资料的t检验处理单因素k(k>3)水平设计的资料
2.1 忽视t检验的前提条件
正确的做法:应将表7的形式改成重复测量试验设计的标准形式,采用与之
2.6 误用t检验处理单因素k(k>3) 设计的资料
原文题目:“莪术对大鼠在体子宫肌电活动的影响及其机制研究”,文章为观察莪术水煎剂对未孕大鼠子 宫肌电活动的影响,40只大鼠被随机分成4组,对照组:按10ml/kg鼠重灌服生理盐水,莪术组:按10ml /kg鼠重分别灌服25% 、50% 、100%莪术水煎液分成3组。观察每个大鼠子宫肌电爆发波的峰面积、持 续时间和个数。原作者应用配对设计定量资料的t检验进行统计处理,资料见表4。
辨析:
确切的统计量和P值。
☻ 计算相对数时,分母过小,相对数很不稳定,易失真,不但不能正确反映事实真相,还往往会造成错觉。
☻ 在表4中,各组样本例数都小于20,样本例数偏小,不宜计算率,直接给出例数就可以。
3.2 误用χ2 检验分析结果变量为有序变量的资料
• 某医生用A、B两药治疗某病各240例,其疗效分为四个等级:痊愈、显效、好转、无效,见表4。经
辨析:本研究设计类型为:两因素(处理和时间)重复测量设计资料。 在资料满足“独立性”、“正态性”和“方差齐性”的前提条件下,及进行球对称检验,应选用两
因素设计的重复测量的方差分析,选用t检验分析该资料是不妥的。
2.5 误用t检验处理重复测量的两因素试验设计2
❖文题:复方苦参注射液对恶性肿瘤患者伽玛刀放射治疗后T淋巴细胞亚群的影响。 ❖设计:作者选取60例恶性肿瘤患者,随机分成2组。试验组在伽玛刀放射治疗的同时给予复方苦参注射液
文题:止痛如神汤保留灌肠治疗CNUP:双盲随机安慰剂对照试验
表4 两组临床主要症状和结肠镜肠粘膜病变评分(
)x s
症状
G1组(n=60)
治疗前
治疗后
G2组(n=60)
治疗前
治疗后
腹痛 腹泻 脓血便 下坠感 充血、水肿 粘膜糜烂 粘膜溃疡 总评分
2.01+0.68※ 2.09+0.82※ 1.82+0.42※ 2.22+0.57※ 1.89+0.37※ 1.58+0.60※ 1.81+0.62※ 15.76+3.11※
有改变。
3.3 误用χ2检验回答相关性问题
年龄
50~ 60~ 70~ 合计
表 不同年龄冠状动脉粥样硬化程度的分布
冠状动脉硬化等级
正常
轻度
中度
43
188
14
1
96
72
6
17
55
50
301
141
高度 245 169 78 492
上述资料用χ2检验得:χ2 =163.01,P<0.005,结论为:可认为冠状动脉硬化的程度与年龄有关,
单因素方差分析
配对t检验
Kruskal-Wallis H秩和检 验
Wilcoxon符号秩和检验
随机区组设计方差分 析
Friedman M秩和检 验
定 无序 性
资
料 有序
二项分布直接 计算概率法、 正态近似法(Z 检验)
____
2检验、Fisher确
R C表资料
2
检验、Fis
配对四格表
2
切概率法
her确切概率法
检验
Wilcoxon秩和检验
Kruskal-Wallis H秩和检 验
Wilcoxon符号秩和检验
R 列R联表
配对 检2 验
2×2表 2×C表 R×C表
多维列联表
11种形式的列联表
无序(成组) 有序(配对)
无序 有序
R×2表
无序 有序
单向有序 双向有序
无序 有序 分组变量有序 指标变量有序 属性相同 属性不同
2.3 忽视方差分析的前提条件
文题:姜黄素抑制晶状体上皮细胞增殖的信号转导机制。 问题:作者取健康小牛眼晶状体的混合消化液消化后,收集细胞,进行传代培养,取第三代细胞进行实 验。 实验分3组:空白对照组、模型组、姜黄素组,每组设6个样本。 请问:采用方差分析正确吗?
均数±标准 差??
确切的统计量和P值
2.3 忽视方差分析的前提条件
辨析: ★此实验分3组,应为单因素三水平设计定量资料,应首先进行“独立性”、“正态
性”和“方差齐性”检验,如果满足方差分析的3个前提条件则用方差分析;如果 不满足,则采用变量变换或秩和检验。如果P<0.05,则进行多组均数间的多重比较。 ★给出确切的统计量和P值。