当前位置:文档之家› 2 列联表分析(Crosstabs)

2 列联表分析(Crosstabs)

计 (其余的省约) 统 结果分析:
华 从交叉表(Crosstab)对角线中看出,只有“五月气温与玉米螟卵高峰发生期”对角线上
出现的频数大于期望值(5>2.7,3>2.0,3>1.3)。
中 从卡方检验表得知,也只有“五月气温与玉米螟卵高峰发生期”能通过线性间的联合检验
(Linear-by-Linear Association),双尾检验 p<0.012。
中华统计学习网
圣才学习网
中华统计学习网
圣才学习网
在结果窗口中查看计算结果,主要输出内容如下。 五月气温 * 玉米螟卵高峰发生期 Crosstab
玉米螟卵高峰发生期
Total
习 学 计 统 华 中
Chi-Square:卡方检验。选中可以输出皮尔森卡方检验(Pearson)、似然比卡方检验 (Likelihood-ratio)、连续性校正卡方检验
(Continuity Correction)及 Fisher 精确概率检验(Fisher’s Exact test)的结果。 Correlations:选中输出皮尔森(Pearson)和 Spearman 相关系数,用以说明行变量和
1)输入分析数据
67
1 3 1 2 1
om 69 70 71 72 73 74 75 76 77 tj.c 3 2 1 2 2 3 2 2 1 0 1 2 3 1 1 1 2 2 1 0 1 1 2 3 1 1 1 1 2 10 2 1 2 1 2 3 2 3 1 www. 1 3 1 1 2 1 1 1 1
6 月 20 日 6 月 21-25 6 月 25 日


以后
Hale Waihona Puke 16.5 以下 Count(频数) 1
Expected
五月
Count(期望值)
气温 16.6-17.8 Count(频数) 2
Expected
Count(期望值)
17.8 以上 Count(频数) 5
Expected
Count(期望值)
Total
中华统计学习网
圣才学习网
3)设置分析变量 0t 选择行变量:将“五月气温[x1],六月上气温[x2],六月上降雨[x3],六月中降雨[x4]”变 0 量选入“Rows:”行变量框中。 0 选择列变量:将“玉米螟卵高峰发生期[y]”变量选入 “Columns:”列变量框中。 1 4)输出条形图和频数分布表 w. Display clustered bar charts:选中显示复式条形图。 w Suppress table:选中则不输出多维频数分布表。。 w 5)统计量输出 网 点击“Statistics”按钮,弹出统计分析对话框(如下图)。
列变量的相关程度。
中华统计学习网
圣才学习网
中华统计学习网
圣才学习网
Nominal:两分类变量的关联度(Association)测量 Contingency Coefficient:列联系数,其值越大关联性越强。 Phi and Cramer’s V:Cramer 列联系数,其值越大关联性越强。 Lambda:减少预测误差率,1 表示预测效果最好,0 表示预测效果最差。 Uncertainty Coefficient:不定系数
均气温 x2(℃)分为 3 级(1 级为 20℃以下,2 级为 20.1-21.5℃,3 级为 21.5℃以上),6
月上旬降雨量 x3(mm)分为 3 级(1 级为 15mm 以下,2 级为 15.1-30mm,3 级为 30mm 以
上),6 月中旬降雨量 x4(mm)分为 3 级(1 级为 29mm 以下,2 级为 29.1-36mm,3 级为
中华统计学习网
圣才学习网
列联表分析(Crosstabs)
列联表是指两个或多个分类变量各水平的频数分布表,又称频数交叉表。SPSS 的
Crosstabs 过程,为二维或高维列联表分析提供了 22 种检验和相关性度量方法。其中卡方检
验是分析列联表资料常用的假设检验方法。
m Kappa:吻合度系数,其取值-1 至+1,其值越大吻合程度越高。 o Risk:危险度分析。 c McNemar:配对计数资料的卡方检验。 . Cochran’s and Mantel-Haenszel statistics:检验在协变量存在下,两个二分类变量是否 j 独立。 0t 6)设置列联表的显示 www.100 单击“Cells”按钮,弹出列联表显示内容对话框(如下图)。
Ordinal:两有序分类变量(等级变量)的关联度测量 Gamma:关联度,+1 表示完全正关联,-1 表示负关联,0 表示无联。 Somers’d:列联度,其取值范围和意义同上。 Kendall’s tau-b:
Nominal by Interval:一个定性变量和一个定量变量的关联度 Eta:关联度统计量。
例子:山东烟台地区病虫测报站预测一代玉米螟卵高峰期。预报发生期 y 为 3 级(1 级
为 6 月 20 日前,2 级为 6 月 21-25 日,3 级为 6 月 25 日后);预报因子 5 月份平均气温 x1
(℃)分为 3 级(1 级为 16.5℃以下,2 级为 16.6-17.8℃,3 级为 17.8℃以上),6 月上旬平
36mm 以上)。数据如下表。 山东烟台历年观测数据分级表() 59 60 61 62 63 64 65 66
年份 y 13113112 x1 3 2 2 3 1 3 2 3 x2 1 2 3 1 1 2 2 1 x3 3 1 1 3 1 2 1 3 x4 3 1 1 1 1 1 1 1 注:摘自《农业病虫统计测报》131 页。
Count(频数) 8
Expected
Count
Chi-Square Tests
Value
df
Pearson Chi-Square 皮尔森卡方检验
7.750(a)
4
2
3
6
2.7
2.0
1.3
6.0
3
1
6
m 2.7
2.0
1.3
6.0
co 1
0
6
. 2.7
2.0
1.3
6.0
0tj 6
4
18
0 8.0
6.0
中华统计学习网
圣才学习网
中华统计学习网
圣才学习网
Adj.Standardized:调整的标准化残差分析。 Noninteger Weights: ⊙ Round cell counts:临近列计算。 ○ Truncate cell counts:。 ○ Round case Weights 临近记录度量 ○ Truncate case Weights ○ No adjustments:不调整。 7)设置输出格式 单击 Format 按钮,弹出列联表输出格式对话框(如下图)。
4.0
18.0
w.10 Asymp.Sig.(2-sided) ww.101
Likelihood Ratio 似然比卡方检验 8.510
网 4
.075
Linear-by-Linear Association N of Valid Cases
习 6.248
1
学 18
.012
a 9 cells (100.0%)have expected count less than 5.The minimum expected count is 1.33.
Row Order:频数 0 ⊙ Ascending:行变量从小到大升序排列。 0 ○ Descending:行变量从大到小降序排列。 1 8)设置检验 www. 单击“Exact”按钮,弹出精确检验对话框(如下图)。
网 习 学 计 统 华 中
⊙Asymptotic only 近似的,系统设置。 ○Monte Carlo Confidence level:99% 置信度,系统默认 99%。 Number of samples:10000 样本数量,系统默认 10000。 ○Exact Time limit per test:5 minutes 限时检验时间,系统默认值 5 分钟。 9)提交执行 设置完成后,在列联表分析对话框中,点击 OK 按钮,计算结果输出在结果窗口中。 10)结果与分析
网 习 学 计 统 华 中 Counts:频数
Observed:观测频数。 Expected:期望频数。 Percentages:百分比 Row:占本行的百分比。 Column:占本列的百分比。 Total:占全部的百分比。 Residuals:残差分析 Unstandardized:非标准化残差分析。 Standardized:标准化残差分析。
在数据编辑器窗口打开“data1-3.sav”数据文件。
数据文件中变量格式如下:







2)调用分析过程 在菜单选中“Analyze-Descriptive- Crosstabs”命令,弹出列联表分析对话框,如下图
中华统计学习网
圣才学习网
因此,玉米螟卵高峰发生期与五月气温有密切的关系,五月气温越高,发生越早。
中华统计学习网
圣才学习网
相关主题