应用SPSS软件进行列联表分析
在许多调查研究中,所得到的数据大多为定性数据,即名义或定序尺度测量的数据。
例如在一项全球教育水平的研究中,调查了400余人的个人信息,包括性别、学历、种族等,对原始资料进行整理就可以得到频数分布表。
定义四个变量:gender(性别)、educat(学历)、minority(种族)、count(人数),其中前三个为分类变量,并且gender变量取值为0、1,标签值定义为:0表示female,1表示male;educat变量取值为1、2、3,标签值定义为:1表示学历低,2表示学历中等,3表示学历高;minority变量值为0、1,标签值定义为:0表示非少数种族,1表示为少数种族。
下面做gender、educat、minority的三维列联表分析及其独立性检验。
数据文件如图1所示。
图1
第一步:用“count”变量作为权重进行加权分析处理。
从菜单上依次选Data--weight Cases 命令,打开对话框,如图2所示。
图2
点选Weight Cases by项,并将变量“count”移入Frequency Variable栏下,之后单击OK按钮。
第二步:从菜单上依次点选Analyze--Deseriptive Statistics--Crosstabs命令,打开列联分析对话框(Crosstabs),如图3所示。
图3
第三步:在Crosstabs对话框中,如图4将变量性别gender从左侧的列表框内移入行变量Row(s)框内,并将受教育年限编码后得到的学历变量educat移入列变量Column(s)框内(若
此时单击OK按钮,则会输出一个2*3的二维列联表)。
这里要输出一个三维列联表,将变量种族minority作为分层变量移入Layer框中,并且可以勾选左下方的Display clustered bar charts项,以输出聚集的条形图,如图8图9所示。
图4
第四步:选择统计量,单击Cosstabs对话框下侧的Statistics按钮,打开其对话框,如图5 所示。
图5
在Statistics对话框内,勾选Chi-square项,以输出表2进行独立性检验。
这里由于不是定距
及定比尺度测量的数据,因此可以不选择简单相关系数Correlations 项。
接下来根据数据的类型而选择相应的列联相关的测量值:在定类数据Nominal 栏下,勾选列联系数Contingency coefficient 和Phi and Cramer ’s V 选项(这里Phi 系数可以不选,因它只用于2*2的列联表,但SPSS 把它与Cramer 的V 统计量放在一个选项上,也就只好一并选上了),以及Lamabda 和不确定系数Uncertainty coefficient 。
也可选择定序数据Ordinal 栏下得Gamma 、Somers 的d 、Kendall 的b τ和c τ。
至于Nominal by Interval 栏下的Eta 选项就不必选了,因为这里不是定距及定比尺度测量的数据。
单击Continue 按钮回到Crosstabs 主对话框。
第五步:单击Crosstabs 对话框下侧的Cells 按钮,打开其对话框,如图6所示。
在Cell Display 对话框内,勾选Counts(计数)栏下的Observed(观测频数)与Expected(期望频数)两个选项;并勾选Percentage 百分栏下得Row(行百分比)、Column(列百分比)和Total(总百分比)三个选项。
由此,可以输出列联表(如表1)。
单击Continue 按钮回到Crosstabs 主对话框。
图6
第六步:单击Crosstabs 对话框下侧的Format 按钮,打开Table Format 对话框,如图7所示。
它只是一个输出格式的定义,行序(Row Order )按照Ascending(升序)还是Descending(降序)排列,系统隐含设置是按照Ascending(升序)排列(事实上,一般不必打开此对话框,只用系统隐含设置即可)。
单击Continue 按钮回到Crosstabs 主对话框。
图7
第七步:在Crosstabs对话框中,单击OK按钮执行。
输出结果如表1~4所示。
表1性别、学历、种族交叉表
表2卡方检验表
表3方向性测度
表4对称性测度
在三维列联表中,结合图7图8,可以看出:非少数种族的女性低学历的比例为72.9%,高于男性低学历的比例25.8%;而相反女性高学历的比例仅为0.6%,远远低于男性高学历的比例。
在少数种族中,从低学历至高学历,无论男女都是同样的递减趋势,即低学历的所占比百分比高,中等学历的所占百分比其次,最少的就是高学历的所占百分比,只不过女性这种趋势更明显,分别为75%、25%、0%。
图8
图9
χ=93.724,非常大,相应的p值小于0.001.因此在0.001的显著水在非少数种族类型中:2
平下高度显著,即拒绝:性别与学历相互独立的原假设,两者之间具有高度显著的相关关联。
由聚集的条形图可以直观的看到:女性低学历比例比男性高,同时男性高学历比例又比女性高。
χ=5.926,p=0.052>0.05,因此在0.05的显著水平下,没有理由拒绝在少数种族类型内:2
两个变量独立的原假设,表示性别与学历这两个变量之间相互独立,没有显著的相关关联。
在表3的方向性测度(Directional Measures)中,有两类系数:不确定系数(Uncertainty Coefficient)和Somers’d。
每种系数均有三种形式:对称的(Symmetric)、以性别为因变量的及以学历为因变量的。
事实上,我们关心的是两种形式——对称的(Symmetric)和以学历为因变量的。
在这里非少数种族的对称不确定系数为0.173,而少数种族的对称不确定系数为0.050;并且以学历为因变量的非少数种族的对称不确定系数为0.148,而少数种族的列联相关程度高于少数种族的。
在对称性测度(Symmetric Measures)中,Crammer的V值列联表系数、Kendall的τ系数值以及γ值(Gamma),非少数种族的上述各项值均高于少数种族的,显示出预测力以非少数种族更强。
事实上,在少数种族的Crammer的V值列联表系数的近似的p值为0.052,
在0.05的显著水平下不显著。
在列联表分析中,列联表的分布除了观察值的分布外,还要构造条件百分比表。
这个百分比就是由于对比的基数不同,从而分为行百分比、列百分比和总百分比。
所以,列联表由于维数的增加而使得它所包含的信息要比“单个变量”的频数(包括频率)分布表包含的信息多得多,由此我们可以分析出来的内容也更加丰富有价值。
参考文献:数据分析与SPSS应用高祥宝董寒青编著,清华大学出版社
一个资料员的自述
我个人认为作为一名资料员,心态和心理素质一定要好,首先必须和监理处好关系(本着监理就是上帝的宗旨),凡有搞不明白的地方就去请教他们,尽量按监理的要求去做,确保资料签认的通过率,除此以外必须做好自己的本分工作,在每道工序报验前必须先将涉及到本工序的材料报上,及时做好隐蔽工序报验工作,进场材料应及时做台帐,并让监理签字认可(施工单位材料台帐应与监理台帐必须相吻合),所有收(发)文应做记录并让对方签字,所有资料经报验通过后及时将原件按资料组卷目录摆放,并做好汇总,混凝土、砂浆试块制作应及时登记,及时做好桩位轴线偏差记录,每一分项都应有专项施工方案(如土方、钢筋、模板、砌筑、门窗、装饰、保温、屋面、地坪等,钢结构组装、焊接、涂装、安装、高强度螺栓、普通螺栓施工等),并对应做好书面技术交底,并让被交底人签字,所有非本人办理的资料应及时向项目部汇报(如口头汇报无效,应出具书面申请,并要求责任到人)。
主体结构施工应及时做好沉降观测记录(每层一次),钢结构工程根据设计要求也应做沉降观测记录。
检验批报验应做分项工程质量验收记录——分部(子分部)工程质量验收记录——单位(子单位)工程质量验收记录。
混凝土试块如发现有不合格的应及时进行回弹试验(出具混凝土非破损检测报告),商品混凝土应有混凝土质量证明书(搅拌站提供),同一分部、强度等级的试块应按实际组数进行数理或非数理统计评定。
所有设计变更应进行汇总,并做好图纸变更台帐(所有设计变更应在竣工图上反应)。
土建部分
1、开工前(具备开工条件的资料):施工许可证(建设单位提供),施工组织设计(包括报审表、审批表),开工报告(开工报审),工程地质勘查报告,施工现场质量管理检查记录(报审),质量人员从业资格证书(收集报审),特殊工种上
岗证(收集报审),测量放线(报审),
2、基础施工阶段:钢筋进场取样、送样(图纸上规定的各种规格钢筋),土方开挖(土方开挖方案、技术交底,地基验槽记录、隐蔽、检验批报验),垫层(隐蔽、混凝土施工检验批、放线记录、放线技术复核),基础(钢筋原材料、检测报告报审,钢筋、模板、混凝土施工方案、技术交底,钢筋隐蔽、钢筋、模板检验批、放线记录、技术复核,混凝土隐蔽、混凝土施工检验批,标养、同条件和拆模试块),基础砖墙(方案、技术交底,提前做砂浆配合比,隐蔽、检验批,砂浆试块),模板拆除(拆模试块报告报审,隐蔽、检验批),土方回填(方案、技术交底,隐蔽、检验批,土方密实度试验)。
3、主体施工阶段:一层结构(方案、技术交底基础中已包含,钢筋原材料、检测报告报审,闪光对焊、电渣压力焊取样、送样,钢筋隐蔽、钢筋、模板检验批、
模板技术复核)。