当前位置:文档之家› 列联表分析

列联表分析


列联表在spss数据集中的排列 r 1 1 1 c 1 2 3 fo 68 75 57
4
5 6 7 8
1
2 2 2 2
4
1 2 3 4
79
32 45 33 31
1、打开数据集; 2、点击data; 2、点击weight cases;弹出weight cases对话框; 3、选择weight cases by; 4、将变量Fo点击进入frequency variable框内,对 其进行加权。
fe
66 80 60 73 34 40 30 37
2 -5 -3 6 -2 5 3 -6
4 25 9 36 4 25 9 36
0.0606 0.3125 0.1500 0.4932 0.1176 0.6250 0.3000 0.9730 2.761
列联表中的卡方检验
已知
0.1
自由度 =
2 14 1 3
列联表是描述两个分类变量的频数分布表。
列联表中的卡方检验
列联表的一般结构
取值少的变量
表示为行变量 R×C列联表 取值多的变量 表示为列变量 单元观 察频数
行变量单元
频数的合计
f ij
C1
C2
C3
C4
合计
R1
f11
f12
f13
f14
RT1
R2
f21
f22
f23
f24
RT2
R3 列变量单元 频数的合计 合计
CT 该单元所在列总频数
n 样本容量
列联表中的卡方检验
观察频数与期望频差异的 大小以 2统计量衡量。

2
f 0 f e 2
fe
0.30 自由度为1 的分布
2
2统计量服从自由度为
0.25 自由度为3 的分布
2
R 1 C 1的分布。
0.20
0.15
态 度 * 公 司 Crosstabulation 公司 态度 赞成 Count Expected Count % within 态 度 % within 公 司 % of T otal Count Expected Count % within 态 度 % within 公 司 % of T otal Count Expected Count % within 态 度 % within 公 司 % of T otal 公 司1 68 66.4 24.4% 68.0% 16.2% 32 33.6 22.7% 32.0% 7.6% 100 100.0 23.8% 100.0% 23.8% 公 司2 75 79.7 26.9% 62.5% 17.9% 45 40.3 31.9% 37.5% 10.7% 120 120.0 28.6% 100.0% 28.6% 公 司3 57 59.8 20.4% 63.3% 13.6% 33 30.2 23.4% 36.7% 7.9% 90 90.0 21.4% 100.0% 21.4% 公 司4 79 73.1 28.3% 71.8% 18.8% 31 36.9 22.0% 28.2% 7.4% 110 110.0 26.2% 100.0% 26.2% Total 279 279.0 100.0% 66.4% 66.4% 141 141.0 100.0% 33.6% 33.6% 420 420.0 100.0% 100.0% 100.0%
总赞成比率:
赞成 反对 合计
RT 1 279 100% 66.4% n 420
68
75
57
79
279
32 100
45 120
33 90
31 110
141 420
总反对比率:
RT 2 141 100% 33.6% n 420
如果
H 0为真,则总比率对各公司都适用。于是可根据总比率得出各单元的期望频数。
结论: 接受“赞成的比率一致”的原假 设。即集团公司所属四个分公司的全体
查表得临界值
2 0.1 3 6.251
经计算

2
f 0 f e 2
fe
3.0319 6.251
职工一致赞成此项改革。样本数据中赞
成比率的差异由抽样的随机性所造成。
接受域
拒绝域
自由度为3的 分布
合计
RT1 RT2
自由度 R 1C 1 2 16 1 5
合计
列联表中的卡方检验
fo
68 75 57 79 32 45 33 31
2 f e f o f e f o f e 2 f o f e 2 f e 2 f 0 f e
2
0.1
0 2.761 6.251
2
用SPSS作卡方分析
关于改革方案调查结果的样本数据 公司1 赞成 公司2 公司3 公司4 合计
68
75
57
79
279
反对 合计
32 100
45 120
33 90
31 110
141 420
定义变量 序号 态度 赞成 反对 r 1 2 公司 公司1 公司2 公司3 公司4 c 1 2 3 4 观察频数 fo 68 75 57 79 32 45 33 31 1 2 3
45
37.5 120 100
33
36.7 90 100
31
28.2 110 100
141
33.6 420 100
从样本数据上看,各公司的赞成(反对)比率存在差异。
从样本到总体的外推可通过假设检验完成。
H0 :
赞成的比率一致。 赞成的比率不一致。
H1 :
列联表中的卡方检验
观察频数(observed frequency 简写 f0) 公司1 公司2 公司3 公司4 合计
合计 基本满足 160 60 220 能够满足 20 10 30 250 140 390
r
系 别
两变量间的关系及 统计分析方法选择 数值型变量 因变 量Y 顺序型变量 分类型变量 卡方分析 分类型变量 方差分析
自变量X 顺序型变量 数值型变量 回归分析 秩的方法 逻辑斯蒂分析
3×4列联表 C1 R1 R2 R3
合计 合计
C2 f12 f22 f32 CБайду номын сангаас2
C3 f13 f23 f33 CT3
C4 f14 f24 f34 CT4
合计 合计
f11 f21 f31 CT1
RT1 RT2 RT3
自由度 R 1C 1 3 14 1 6
2×6列联表 C1 R1 R2 f11 f21 CT1 C2 f12 f22 CT2 C3 f13 f23 CT3 C4 f14 f24 CT4 C5 f15 f25 CT5 C6 f16 f26 CT6
反对
Total
为了解非计算机专业对计算机课程教学的意见,在金融系和统计系本 科生中进行了一次抽样调查,得到了390名学生的调查数据。试据此推断两 系本科生对计算机课程教学的意见是否一致。
关于计算机课程教学意见的样本数据 C fo 不能满足 金融系 统计系 合 计 70 70 140 意 见
[数据集8]
列联表中的卡方检验
关于改革方案调查结果样本数据列联表的自由度
公司 1
赞成 反对 合计 68
公司 2
75
公司 3
57
公司 4
79
合计
279
32
45
33
31
141
100
120
90
110
420
自由度= R 1C 1 2 14 1 3
列联表中的卡方检验
自由度用以衡量列联表的大小。
f31
f32
f33
f34
RT3
CT1
CT2
CT3
CT4
n
样本
容量
列联表中的卡方检验
赞成或反对的比率的样本数据 公司1 频数 赞成 比率% 68.0 62.5 63.3 71.8 66.4 68 公司2 75 公司3 57 公司4 79 合计 279
频数
反对 比率% 频数 合计 比率%
32
32.0 100 100
0.10
自由度为10 的分布
2
自由度为20 的分布
2
0.05 0.00 0 2 4 6 8 10
2
列联表中的卡方检验
寻找自由度
C1
C2
合计
R1
f11
f12
RT1
R2
f21
f22
RT2
合计
CT1
CT2
n
自由度是可以自由取值的数据个数。
列联表中的行与列的总和是固定的。总有 一行和一列的取值不是自由的。自由度= (R-1)(C-1)=(2-1)(2-1)。
观察频数
本例中选择频 数中的两选项
期望频数
频率
残差
行频率
未标准化
列频率
已标准化
总和频率 已由标准误标准化
行顺序
升序
降序
2 2.761 自由度 3 P值 0.430 0.05
故接受原假设。即四个分公司态度一致。
如果在crosstabs cell display对话中,选择了count中的observed和expected 与percentages中的row、column和 total,系统将输出如下列联表。
列联表中的卡方检验
某集团公司打算进行一项改革,但此项改革涉及
到各分公司的利益。今采用抽样方法分别从下设的四 个分公司中共抽取420名职工了解对此项改革的看法。 如果四个分公司对改革的看法一致,则决定实施这项 改革。调查结果如下表所示:
相关主题