当前位置:文档之家› SAS统计分析(第九讲)

SAS统计分析(第九讲)


2020/3/3
8
▪ 半参数法 不知生存时间分布确切类型,用模型的方法对 模型的部分参数作统计描述与推断。常用的是Cox模型。 相应的SAS过程为:phreg。
注:半参数法与参数法可用来研究多个因素对生存时间 的影响,非参数法难以实施多因素生存分析。
非参数法的lifetest过程
❖ 语法格式: proc lifetest [选项];
Test
Chi-Square DF Chi-Square
Log-Rank 时序检验 7.6283 1 0.0057
Wilcoxon Breslow检验 6.5472 1 0.0105
-2Log(LR) 似然比检验 5.0557 1 0.0245
2020/3/3
17
2020/3/3
18
❖ 大样本资料的寿命表法
2020/3/3
13
Summary Statistics for Time Variable t
Point 95% Confidence Interval
Quantile Estimate [Lower, Upper)
四分位数 点估计
95%可信区间
75% 42.0000 30.0000 .
50% 38.0000 13.0000 42.0000
Mean Standard Error 11.8889 3.2806
Summary of the Number of Censored and Uncensored Values
Stratum group
Percent Total Failed Censored Censored
1
A
11
8
3
27.27
生存概 率pi
(7)
0.7594 0.7324 0.7548 0.8344 0.8298 0.9227 0.9463 0.9845 0.9496 0.9612 1.0000
生存率 si(ti+1)
(8)
0.7594 0.5562 0.4198 0.3503 0.2907 0.2682 0.2538 0.2499 0.2373 0.2281 0.2281
图12-1 10例中晚期肺癌患者的生存曲线
2020/3/3
5
❖ 中位生存时间
前面提到,由于存在删失数据和生存时间的不对称性,不适 宜用算术均数描述平均生存时间。适宜的统计量是中位生存时 间。如果全部为完整数据,没有删失数据时,中位生存时间是 指50%位数的生存时间。如果有删失数据时,中位生存时间是 指当生存率恰好达到50%时的随访时间。如果删失数据比较多, 死亡对象未能占研究对象总数的50%以上时,中位生存时间则 无法估计。在例12-1中,随访时间在911天时,生存率从 0.667下降到0.444,那么中位生存时间就是911天。
11 5 -7 13 13 23 30 -30 38 42 42 -45 9 1 3 3 7 10 15 15 23 30 ; proc lifetest plots=(s); time t*censor(0); strata group; run;
12
The LIFETEST Procedure
/*只能在指定方法为寿命表法时使用。用寿命表法分析时,程序会 自动给定生存时间的区间。如果人为规定生存时间的分组区间,则需 用该选项指定。*/
2020/3/3
10
3. Plots=(绘图类型) 要求输出生存分析图。可供输出的图形有: ▪ S 对生存函数S(t)作图。横、纵坐标分别为t,S(t)。 ▪ H 对风险函数作图。横、纵坐标分别为t,H(t)。只适用于 寿命表法
5
4
15.0000
.
.
.
6
3
15.0000 0.2222
0.7778 0.1386
7
2
23.0000 0.1111
0.8889 0.1048
8
1
30.0000
0
1.0000
0
9
0
2020/3/3
15
Summary Statistics for Time Variable T Point 95% Confidence Interval Quantile Estimate [Lower, Upper) 75% 15.0000 7.0000 30.0000 50% 10.0000 3.0000 15.0000 25% 3.0000 1.0000 15.0000
例14-5
表14-2 374名恶性肿瘤病人随访资料生存率计算
随访月数 ti (1)
012345678910-
期初观 察人数 ni(2)
374 284 208 157 120
95 79 66 62 54 47
期内死 亡人数 di (3)
90 76 51 25 20
7 4 1 3 2 0
期内失 访人数 wi (4)
2
B
9
9
0
0.00
--------------------------------------------------------------------------------------
Total
2020/3/3
20
17
3
15.00
16
Test of Equality over Strata
Pr >
2020/3/3
11
data ex14_1; do group='A','B'; input n; do i=1 to n; input t @@; if t<0 then censor=0; else censor=1; t=abs(t); output; end; end; cards;
2020/3/3
Survival 生存率
1.0000 0.9091
. . 0.7071 0.6061 0.5051 . 0.3788 . 0.1263 .
Survival
Standard
Failure
Error
死亡率 生存率标准误
0
0
0.0909 0.0867
.
.
.
.
0.2929 0.1429
0.3939 0.1541
25% 13.0000 5.0000 38.0000
Mean Standard Error
29.1414 4.5151
生存时间均数 均数的标准误
The mean survival time and its standard error were underestimated because
the largest observation was censored and the estimation was restricted to
0 0 0 12 5 9 9 3 5 5 47
校正人 数 n’
(5)
374.0 284.0 208.0 151.0 117.5 90.5
74.5 64.5 59.5 51.5 23.5
死亡概 率qi
(6)
0.2406 0.2676 0.2412 0.1656 0.1702 0.0773 0.0537 0.0155 0.0504 0.0388 0.0000
2020/3/3
6
❖生存分析的三种变量 1.目标变量 即生存时间,常记为t 。
2.协变量 可以是研究因素,也可以是排除其影响的因素, 常记为x1,x2,┄,x p。 3.删失变量 常记为censor或d等。 ❖生存分析的任务 估计生存率;比较生存率;寻找影响因素。
2020/3/3
7
❖生存分析的方法
time <生存时间变量*截尾指示变量(数值)>;
[strata<分组变量名列>;] /*指定比较的分组变量,按分组变量名
列分别进行分析和比较。*/
2020/3/3
9
[ test<协变量名列>;] /*指定协变量名列,检验生存时间与该变量是
否有关 */
[ freq <变量名>;]
/*
Left
0.0000 1.0000
0
0
0
9
1.0000 0.8889
0.1111 0.1048
1
8
3.0000
.
.
.
2
7
3.0000 0.6667
0.3333 0.1571
3
6
7.0000 0.5556
0.4444 0.1656
4
5
10.0000 0.4444
0.5556 0.1656
❖ PROC过程[选项]
1.method=方法 /*指定估计生存率所用的方法:*/
▪ PL /*要求用乘积极限法(即Kaplan-Meier 法)估计生存率并计
算中位生存时间等,为缺省方法。*/
▪ LT /*要求用寿命表法估计生存率等。*/
2.intervals=(初值 to 终值 by 步长) 或 width=数值
the largest event time.
2020/3/3
14
The LIFETEST Procedure
Stratum 2: group = B
Product-Limit Survival Estimates
Survival
Standard Number Number
t
Survival
Failure
0.4949 0.1581
.
.
0.6212 0.1613
.
.
0.8737 0.1163
相关主题