临床试验相关统计分析
生存资料的分析方法
描述 -生存时间 生存率 风险率 • 非参数法 -KM法 、寿命表 (LIFETEST) • 参数法- 指数模型、Weibull模型、Gompertz模型 ( LIFEREG) • 半参数法- COX回归 (PHREG)
03
数据分析
数据分析
推断性描述:1. t 检验
1.1 单样本t检验(The One-Sample t-Test):临床试验中应用最广泛的是在配对数据, 包括开放性试验前后比较和随机对照试验中组内比较
回归系数b
优势比OR
RR
至少变量数的10倍
至少变量数的20倍
非截尾例数至少变量数的10倍
应用
因素分析 预测预报 Y
因素分析 预测、判别P(Y=1)
因素分析 生存预测 S(t)
04
结果解读
结果解读
P值与置信区间
e.g.: 一项样本量为804的对照试验,Enalapril组和hydralazine 联合nitrates组 的死亡率分别为33%和38%,两组死亡率差异为5%, p=0.11(95%可信区间: -1.2%~ 12%)
1. 不能排除疗效差异有临床意义 2. 区间范围大根源:样本量较少,阴性结果可能是样本量较少造成
结论:可能样本量不足,无法检验出两组差异
结果解读
:P >0.05
上限小于临床最小有意义值, 试验结论阴性
上限大于临床最小有意义值, 试验结论不确定
阳性结果:P <0.05
连续型:是指X可以取某一区间的所有值。比如,我们定义X为收缩压血压值,理论 上来说X可以取任意非负值
数据分类
参数估计与非参数估计
参数检验parameter test,对参数平均值、方差进行的统计检验
参数检验是针对参数做的假设,非参数检验是针对总体分布情况做的假设
参数检验要利用到总体的信息(总体分布、总体的一些参数特征如方差),以总 体分布和样本信息对总体参数作出推断;非参数检验以样本信息对总体分布作出推 断。
PROC TTEST; PAIRED WTPRE*WTPST; RUN;
1.2 两样本t检验(The Two-Sample t-Test):应用于随机对照试验中组间比较
PROC TTEST; CLASS GROUP; VAR CHANGE; RUN;
T检验要求:正态分布, 方差齐性,(but中心极限定理,>50/组) 方差齐性 (TTEST)和正态性检验 (UNIVARIATE ) H0假设是 方差齐和正态分布,P>0.05 表示不拒绝H0,数据方差齐/正态分布
FAS 全分析集
从所有随机化的病人中以合理的方法尽可能少地排 排除:(1)违反IE ;(2)病人未曾
除病人
用药;(3)随机化后没有任何数据
PP 符合方案集
Keep:(1)完成了预先确定的治疗 ITT的一个子集,其中更加符合方案的一部分病例 最小量(2)主要变量可以测定(3)
没有重大违反方案
SS(safety set) 至少接受过一次研究药物治疗的随机化病人
安全性分析指定数据集
*Based on ICH E9
数据分析集
常见分析集 analysis set 及其应用
ITT population:Austin Bradford Hill (1955)
(1)从随机化的角度,随机化的目的在于保证受试者一些可能影响结局的因 素在分配的治疗组间保持均衡
(2)从临床实践的角度,药物疗效分析有两部分( Pragmatic + Explanatory)
least square means VS. means
中心 1 2
A 2, 2, 2 6, 7
B 4, 5 2, 4, 6
means的计算:A=(2+2+2+6+7)/5=3.8; B=(4+5+2+4+6)/5=4.2 Lsmean的计算:A= (2+6.5)/2=4.25 ; B= (4.5+4)/2=4.25
PROC NPAR1WAY WILCOXON; CLASS TREAT; VAR SCORE; RUN;
数据分析
推断性描述:4.卡方分析 4.1 Chi-Square Test即卡方检验,主要用来率的比较
2*2:PROC FREQ; TABLES GROUP*RESPONSE/CHISQ; RUN; R*C: PROC FREQ; TABLES GROUP*RESPONSE/CMH; RUN;
证实性临床试验(confirmatory trial)中,通常同时进行ITT分析和PP分 析,
02 数据分类
数据分类
数据资料与对应统计变量
数据分类
随机变量分类
随机变量: 离散型(discrete)和连续型(continuous)
离散型:是指X的取值是有限个或可列无限个。比如我们掷硬币,我们定义随机变 量是正面的次数,那么我们掷10次,那么X的取值只能是0,1,2,3,4,5,6,7,8,9,10
Lsmean 是考虑消除区组因素后的mean,先计算 区组内mean再计算治疗组间mean。
数据分析
推断性描述:3. 秩和检验 3.1 Wilcoxon Signed-Rank Test (Wilcoxon符号-秩检验)最常用于配对数据
PROC UNIVARIATE; VAR DIFF; RUN;
3.2 Wilcoxon Rank-Sum Test(Wilcoxon秩和检验)用于两个独立样本的非正态分布 数据的比较,也称为Mann-Whitney U Test,两者是等价的,计算出的p值也是相同的。
PROC NPAR1WAY WILCOXON; CLASS TREAT; VAR SCORE; RUN; 3.3 Kruskal-Wallis Test:临床试验中常用来比较三个Wilcoxon Rank-Sum Test或 三个以上剂量组或治疗组非正态分布变量的比较。
EMEA(The European Agency for the Evaluation of Medicinal Products) guideline: 1. 优效性试验的主要分析集应为ITT,PP可作为其证实性分析集。 2. 非劣效/等效试验中,ITT和PP具有同等重要的作用,并需要两者的结论相似。
Y=1x1 + 2x2 +•••+ mxm
h(t,x)=h0(t)exp(1x1 + 2x2 +•••+ mxm )
变量筛选 参数估计 参数检验
参数解释 样本含量
前进法;后退法;逐步法
最小二乘法
最大似然法
最大似然法
F-test t-test
似然比检验
似然比检验
Wald检验 score检验 Wald检验 score检验
下限小于临床最小有意义值, 试验结论不确定
下限大于临床最小有意义值, 试验结论阳性
谢谢
临床试验相关统计分析
目录
01
数据分析集
数据分析集
常见分析集 analysis set 及其应用
分析集
ITT
定义解释
Note
最标准的最严格的ITT定义简单说就是“一旦随机,
就要分析”
不管是否用药,DV,用错药
Practical ITT/MITT 从所有随机化病人中以合理的方式排除一些病人
随机并吃药,至少一个有效性指标有 随访数据
生存资料特点 : 1 生存时间的分布一般为非正态分布 指数分布,对数正态分布 ,Weibull分布,Gamma分布,……
2 含有截尾数据(censored data) 截尾数据提供的信息是不完全的 是否出现、何时出现结局不知道
数据分类
生存资料分析
生存资料的分析 估计: Kaplan- Meier法,寿命表法 比较: log-rank检验 影响因素分析:Cox比例风险回归模型(Cox回归模型) 预测: Cox回归模型预测生存率。
FISHER:Fisher’s Exact Test 精确检验 存在格子数<5 AGREE: McNemar’s Test 配对率的前后 比较
数据分析
推断性描述:5. 回归分析
数据类型 模型结构
多元线性回归
logistic回归
Cox回归
Y数值变量
Y分类变量
Y二分类变量+时间
X数值变量、分类变量、等级变量
检验功效参数检验大于非参数检验,参数检验只能用于正态分布数据
数据分类
生存资料
生存分析(Survival analysis)是指根据试验或调查得到的数据对生物或人的生存 时间进行分析和推断,研究生存时间和结局与众多影响因素间关系及其程度大小 的方法,也称生存率分析或存活率分析。(20th 30s,1972 Cox)
1. p=0.11>0.05 两组死亡率差异没有统计学意义
2. 95%CI:-1.2%~ 12% 包含0,p 值>0.05
结论:两组治疗没差异
结果解读
P值与置信区间 e.g.: 一项样本量为804的对照试验, Enalapril组和hydralazine 联合nitrates组 的死亡率分别为33%和38%,两组死亡率差异为5%, p=0.11(95%可信区间: -1.2%~ 12%) 95%CI:-1.2%~ 12% 差异上限12% 区间跨度大 检验power 约为31%
PROC GLM; CLASS GROUP CENTER; MODEL CHANGE=GROUP CENTER GROUP*CENTER/SS3; RUN;
同T检验要求:正态分布, 方差齐性 PROC ANOVA vs. GLM: ANOVA 用于平衡数据,GLM 均可
数据分析
推断性描述:2. 方差分析
数据分析
推断性描述:2. 方差分析