当前位置:文档之家› SAS的卡方检验(正式)

SAS的卡方检验(正式)


四格表卡方检验的SAS程序
• 在SAS/STAT模块中FREQ、TABULATE和SUMMARY 等过程可用于分类资料的统计描述,其中FREQ过程兼具 统计描述和统计推断的功能,对分类变量计算频数分布, 产生从一维到n维的频数表和列联表;对于二维表,可进 行2检验,对于三维表,可作Mentel-Hanszel分层分析 。FREQ过程是SAS用于分析分类资料的一个常用过程。 本节将先向大家介绍FREQ过程的语句及其格式。
例题
• 某医院欲比较异梨醇口服液(试验组)和 氢氯噻嗪+地塞米松(对照组)降低颅内压 的疗效。将200例颅内压增高症患者随机分 为两组。问两组降低颅内压的总体有效率 有无差别?
连续性校正公式
• 2分布是正态变量的一种分布。设 是k个独立的标准正态变量,则 X1,X2,,Xk 。2界值表就是根据这种连续性分布计算出来的 。2统计量计算公式实质上是正态近似法。分类 资料是间断性的,由此计算的2值不连续,尤其
四格表卡方检验的SAS程序
• 如果TABLES语句缺省,则FREQ过程对数据集中的所有 变量都给出相应的一维频数表。不规定任何选项时,若需 某变量的一维频数,FREQ给出该变量每一水平的频数、 累积频数、频数的百分比和累积百分比;若需二维频数表 ,FREQ产生交叉分组列表,即包括各格的频数、总频数 的格百分数、行频数的格百分数和列频数的格百分数。
• 请求式由一个或多个用“*”连接起来的变量名组成。几 个变量可放在括号中,如:
• TABLES A*(B C);等价于TABLES A*B A*C; • TABLES (A-C)*D;等价于TABLES A*D B*D C*D;
四格表卡方检验的SAS程序
• 下列选项可用于TABLES语句中“/”的后面: • OUT=数据集:建立一个包含变量值和频数计数的输出数
Cochran-Armitage趋势检验; • WEIGHT语句:通常每个观察值提供数值1给频计数,
当WEIGHT语句出现时,每个观察值提供的是该观察值的 加权变量值。该值必须非负,但可不必为整数。只能使用 一个WEIGHT语句,且该语句作用于所有的表。
四格表卡方检验
• 理论频数,记为T。理论数的计算公式为:
DATA,按数据集中出现的顺序排列;ORDER= INTERNAL,按内部值排列(缺省);ORDER= FORMATTED,按外部格式值排列; • Table语句指定构成表格的变量和表格结构。表格的结构 由变量个数和变量排列顺序决定,一个table语句允许列 出多个表格结构。PROC FREQ过程中可有多条TABLES 语句,TABLES语句后可接多个表格请求式,每个请求式 可包含任何数量的变量,从而得到所需的表格。
据集。如果TABLES语句中不止一个请求式,数据集的内 容相应于TABLES语句中最后一个请求。 • CHISQ对每层作c2检验,包括Pearson c2、似然比c2和 Mantel-Haenszel c2。此外还给出与c2检验有关的关联 指标包括Phi系数、列联系数和Cramer’s V。对于2×2 表,给出Fisher精确概率。 • AGREE 进行配对c 2检验。 • EXACT 对大于2×2的列联表计算Fisher精确概率。同时 也给出CHISQ选项的全部统计量。
• ALL 给出CHISQ、MEASURES、CMH所请求的全部统 计量。
• ALPHA=p给出检验水准。缺省为0.05。
四格表卡方检验的SAS程序
• EXPECTED给出期望频数。 • DEVIATION给出每格的实际频数与期望频
数的差值。 • CELLCHISQ给出每格对总c2的贡献,即
计算每格的(实际频数-期望频数)2/期望频 数。 • CUMCOL给出累积列百分数。 • NOFREQ不给出列联表中的格频数。 • NOPERCENT不给出列联表中的格百分数 。
四格表卡方检验的SAS程序
• NOROW不给出列联表中各格的行百分数。 • NOCOL不给出列联表中各格的列百分数。 • NOCUM不给出频数表的累积频数和累积百分数。 • NOPRINT不给出表格,但给出CHISQ、MEASURES或
CMH等语句所指定的统计量。 • Trend指令系统对2×C频数表的C个百分率进行
四格表卡方检验的SAS程序
• MEASURES对每层的二维表计算一系列关联指标及相应 的标准误,包括Pearson和Spearman相关系数,以及 Gamma和Kendall系数等。对于2×2表,还给出常用的 危险度指标及其标准误。
• CMH 给出Cochran-Mantel-Haenszel统计量,可检验 在调整了TABLES语句中其它变量后,行变量与列变量之 间的关联程度。对于2×2表,FREQ过程给出相对危险度 估计及其可信区间,还给出各层关联度指标是否齐性的 Breslow检验。
SAS的卡方检验(正式)
华中科技大学公卫学院 流行病与卫生统计系
学习目标
• 掌握四格表普通卡方检验和配对卡方检验方法以及相应的 SAS程序;
• 了解FREQ过程语句格式; • 熟悉R×C表资料的分类类型以及相应的统计检验方法; • 掌握双向无序R×C表资料检验以及SAS程序; • 掌握单向有序R×C表资料检验以及SAS程序; • 掌握趋势卡方检验方法以及SAS程序; • 掌握分层R×C表的分析以及SAS程序;
Trc
nr nc n
四格表卡方检验
• 卡方检验的统计量是2值,它是每个格子实际频 数A与理论频数T差值平方与理论频数之比的累计 和。每个格子中的理论频数T是在假定两组的发病 率相等的情况下计算出来的,故2值越大,说明 实际频数与理论频数的差别越明显,两组发病率 不同的可能性越大。

2 (AT)2 T
• FREQ过程的语句基本格式如下: Proc freq data= order= ; Table 分类变量*分类变量/ <Ooptions>; Weight 变量; Run;
四格表卡方检验的SAS程序
• DATA=数据集:规定PROC FREQ语句使用的数据集; • ORDER=FREQ,按频数递减顺序排列;ORDER=
相关主题