当前位置：文档之家› 临床研究中常用统计分析方法及选择

临床研究中常用统计分析方法及选择

样本数据间的差异有两种原因所致
• 样本来自同一总体，差异因抽样误差所引起 • 样本来自不同总体，差异因不同总体所引起
假设检验以P值大小作为推断依据
• P值大，表示差异由抽样误差引起可能性大 • P值小，表示差异由抽样误差引起可能性小，即由总体不同引起的可能性大 • 一般以0.05作为临界值来判断
比较目的应用条件统计方法二项分布的直接法二项分布的Z检验二项分布的Z检验
样本率与总体率 n较小时的比较 np>5且n(1-p)>5 两个率或构成比 np>5且n(1-p)>5 的比较（完全随 n>40且T>5 机设计） n>40且1<T<5
卡方检验
校正卡方检验
n<40或T<1
Fisher精确检验
3、常用等级资料假设检验方法
比较目的两组比较（完全随机设计）多组比较（完全随机设计）配伍设计配对设计统计方法 Wilcoxon秩和检验秩和检验（H检验）秩和检验（Friedman检验）符号秩和检验
几个例子
实例1 30只大鼠随机分为A、B、C三组，每组10只，分别给予三种药物，5天后测定某指标值如下表。
矛盾：移民组的发病率在各个年龄组均高于英格兰和威尔士组，为什么它的合计发病率反而低？分析中混杂因素的控制
例子3：为鉴别胃癌、胃炎、非胃病患者，各测定了50名对象的铜兰蛋白等指标，其中铜兰蛋白的观察结果如下:
胃癌
228 235 143
187 250
…
胃炎
非胃病
100 153 178
98
143 200
n较小，差值为非正态
多组资料的比较（完全随机设计）配伍资料的比较（配伍设计）正态分布，方差齐非正态分布，方差不齐正态分布，方差齐非正态分布，方差不齐
配对设计的秩和检验
方差分析秩和检验（H检验）配伍设计的方差分析配伍设计的秩和检验（Friedman检验）
2、常用计数资料假设检验方法
◦ 方差是否齐同（相等） ◦ 粗略判断两组标准差之比在2.5倍以上，就得警惕Байду номын сангаас差不齐
描述数值变量资料的常用指标
指标名称均数（X）中位数（M）几何均数（G）标准差(s) 四分位数间距极差（R）变异系数（CV）适用的资料正态分布或近似正态分布偏态分布、分布未知、两端无界对数正态分布、等比资料正态分布或近似正态分布偏态分布、分布未知、两端无界观察例数相近的数值变量比较几组资料间的变异大小
（二）组间比较常用的假设检验方法
根据资料类型选择
计量资料的假设检验
• t检验、F检验（方差分析）、Z检验、秩和检验（Wilcoxon秩和检验、H检验、Friedman检验）等
计数资料的假设检验
• 卡方检验、Z检验等
等级资料的假设检验
• 秩和检验（Wilcoxon秩和检验、H检验、Friedman检验）
• 数据的分布特征（正态、偏态） • 方差齐性 • 理论数大小 • 样本量大小
三、数据资料的描述
108例高血压患者治疗后临床记录
编号年龄性别治疗组舒张压心电图疗效
NO 1 2 3 4 … 108
X1 37 45 43 59 54
X2 男女男女 … 男
X3 A B A B B
X4 11.27 12.53 10.93 14.67 … 16.80
实例3
72只小鼠随机分为3组，每组24只，进行实验，分别于试验后1，3，5，7天处死小鼠6只小鼠，测定大脑中酪氨酸激酶B 的表达水平，如下表。
资料特点：计量资料，三组，重复测量? 析因设计? 不妥的方法：每个时间点用t检验，重复测量的方差分析恰当的方法：3×4析因设计方差分析
实例4 两组手术病人，采用两种不同的镇痛方式（试验组、对照组），于手术后24小时测定血清中的IL-6，结果如下表。
资料特点：完全随机设计，计量资料，三组不妥的方法：t检验恰当的方法：方差分析
实例2
36只大鼠随机分为对照组、实验组1、实验组2三组，每组12 只，分别给予三种饲料，分别于10天、15天、20天、25天测定大鼠体重，如下表。
资料特点：完全随机设计，计量资料，三组，重复测量不妥的方法：每个时间点用t检验或方差分析恰当的方法：重复测量的方差分析
X5 正常正常异常异常正常
X6 显效有效有效无效无效
（一）数值变量资料的描述
通过绘制直方图可以直观了解数据的分布
平均水平
平均水平
变异水平
偏态分布
近似正态分布
偏态分布形状
研究中，右偏态分布更常见，如住院时间，住院费用，病程等左偏态分布较少见，如考生成绩有时呈左偏态分布
方差齐性
无序分类：指类别或属性间无顺序、程度之分
例如，性别（男、女）为二分类血型（A、B、AB、O）为多分类
有序分类：指类别间存在着次序，或程度上的差异。
例如，治疗效果：无效、好转、显效、治愈实验室检验：–、+、++、+++
（四）数据特征
任何统计方法都有自己的适用条件，只有当某个或某些条件满足时，统计计算公式才成立适用条件可根据数据特征来判断
（二）分析目的
对临床资料进行统计描述
◦ 描述性统计分析方法 ◦ 如，均数，中位数，标准差，百分比，频数分布等
估计总体参数
◦ 95%可信区间
对几组资料进行差异性检验
◦ 假设检验方法 ◦ 如，t检验，卡方检验，方差分析，秩和检验等
探讨变量之间的关系，或者自变量（影响因素）对应变量（结果变量）的影响大小
资料特点：计量资料，两组，标准差相差比较大(方差不齐) 不妥的方法：t检验恰当的方法：t’检验或者 Wilcoxon秩和检验
实例5
两组病人，采用两种药物治疗，治疗疗效如下表。经卡方检验，P=0.0486，差异有统计学意义。因此可以认为试验组的疗效比对照组的疗效好。
资料特点：计数资料，两组，例数比较少不妥的方法：卡方检验恰当的方法：Fisher精确检验
2、常用计数资料假设检验方法（续表）
比较目的配对四格表比较（配对设计）应用条件 b+c >40 np>5且n(1-p)>5 统计方法配对卡方检验校正配对卡方检验
多个率或构成比的比较（完全随机设计）
全部格子T>5 或1<T<5小于25% T<1或1<T<5超过25%
卡方检验 Fisher精确检验
（一）研究设计
析因设计
--同时研究多个实验因素对结果的影响 --例如，研究药物剂量(3mg、6mg)及给药方式(口服、肌注) 对结果的影响，每种组合均需要做试验(3mg+口服，3mg+肌注， 6mg+口服，6mg+肌注)，为2×2析因设计
重复测量设计
--同一对象在不同时间点上进行某个指标的观测，以分析该指标在时间上的变化。 --临床上很常见的一类资料
该新药是否值得推广？
假设检验及临床优效性检验
例子2：英国某年全人口统计资料
英格兰和威尔士年龄分组 0~ 5~ 15~ 45~ 65~ 合计人口 (千人) 1900 3100 9400 4900 2000 21300 发病数 1406 186 1786 7350 17400 28128 发病率 (10 万) 74.0 6.0 19.0 150.0 870.0 132.1 人口 (千人) 26 30 127 25 5 213 移民发病数 21 2 27 42 48 140 发病率 (10 万) 80.8 6.7 21.3 168.0 960.0 65.7
中位数
平均水平
均数
平均水平
偏态分布
近似正态分布
变异水平
P25，P75 四分位数间距
标准差
论文中最常用组合
正态分布或近似正态分布:
均数与标准差
偏态分布或未知分布
中位数与 P25、P75（四分位数间距）
（二）分类变量资料的描述
通常需要描述各个类别的频数及频率（百分比）
108 名高血压患者的疗效疗效治愈显效有效无效频数 46 29 18 15 百分比 (%)
1、常用计量资料的假设检验
比较目的样本与总体比较 n较大 n大小均可两组资料的比较（完全随机设计） n较大 n较小,正态分布,方差齐 n较小,非正态分布,方差不齐应用条件 Z检验 t检验 Z检验 t检验 Wilcoxon秩和检验 t’检验统计方法
1、常用计量资料的假设检验（续表）
比较目的配对资料的比较（配对设计）应用条件 n较大（任意分布） n较小，差值为正态统计方法配对设计Z检验配对设计的t检验
…
…
123 170 100 120
问：三种人的铜兰蛋白有无不同？能否根据测定的铜兰蛋白数据对患者进行初步诊断？假设检验及判别诊断
例子4：研究心肌梗死患者预后的影响因素，以是否发生心性死亡作为观察结果指标，对116名心梗患者的22个可能影响预后的因素进行观察和记录
结局指标：心性死亡
预后因素：年龄、性别、高血压病、心梗位置、心梗分级、
实例7
欲研究治疗某病的改进法（传统药+辅药）与传统法（传统药）在不同剂量下的疗效。将150例研究对象随机分成10组，每组15例；每种剂量及每种疗法下观察15例。结果如下表：
资料特点：结果变量：是否有效，二分类（有效、无效）两个影响因素：治疗方法、药物剂量不妥的方法：卡方检验或Fisher精确检验恰当的方法：多因素分析中的Logistic回归分析
实例6
两组病人，采用两种药物治疗，治疗疗效如下表。经卡方检验，P=0.0570，差异无统计学意义。

e商务文档

临床研究中常用统计分析方法及选择

相关文档推荐：