管理统计学综合实验
根据给定的数据Employee data.sav完成以下数据分析:
1.根据出生日期变量生成一个新变量“年龄”,并考察其是否服从正态分布
2.根据雇员的教育水平对起始薪金的平均值进行汇总
3.选择合适的图形考查不同雇佣类别人群的当前薪金的分布
4.通过假设检验来推断不同性别的人群的教育水平是否有差异
5.考察经验和当前薪金之间的数量关系,并建立二者的回归模型,预测当经验为300时,相应的薪金应是多少?
实验步骤及结论:
1.根据出生日期变量生成一个新变量“年龄”,并考察其是否服从正态分布
1)选择“转换”到“计算变量”
2)在“目标变量”中输入“年龄”
3)在“数学表达式”中选择“XDA TE.YEAR”,选择“出生日期”。
以2014为减数。
4)确定
1)选择“分析”到“描述统计”到“P_P图”2)在“变量”中选择“年龄”
3)在“检验分布”中选择“正态分布”
4)确定
模型描述
模型名称MOD_4
序列或顺序 1 年龄
转换无
非季节性差分0 季节性差分0 季节性期间的长度无周期性
标准化未应用
分布类型正态位置估计标度估计
部分排序估计方法Blom
为结指定秩同数的值的秩均值正在应用来自 MOD_4 的模型指定。
个案处理摘要
年龄
序列或顺序长度474 图中的缺失值数
用户缺失0
系统缺失 1 个案未进行加权。
估计的分布参数
年龄
正态分布
位置57.6723
标度11.78409
个案未进行加权。
由图可知,偏差大于0.05,所以不服从正态分布
2.根据雇员的教育水平对起始薪金的平均值进行汇总1)选择“数据”到“分类汇总”
3.选择合适的图形考查不同雇佣类别人群的当前薪金的分布1)选择“图形”到“图表构建程序”
由图可知,职员的当前佣金在27839左右,保管员在30939左右,经理在63978左右。
其中经理最高,职员最低,且相差较大。
4.通过假设检验来推断不同性别的人群的教育水平是否有差异
1)选择“分析”到“比较均值”到“独立样本T检验”
组统计量
性别N 均值标准差均值的标准误
教育水平(年)
男258 14.43 2.979 .185
女216 12.37 2.319 .158
独立样本检验
方差方程的 Levene 检
验
均值方程的 t 检验
F Sig. t df Sig.(双
侧) 均值差值标准误差值差分的 95% 置信区
间
下限上限
教育水平(年)假设方差相等17.884 .000 8.276 472 .000 2.060 .249 1.571 2.549 假设方差不相
等
8.458 469.595 .000 2.060 .244 1.581 2.538
由图可知,F=17.884,P=0.000,由于P值小于0.05,因此拒绝H0,认为两个样本
方差所在总体的方差是不齐的。
因此应选择方差不相等时的t检验结果,即为图
中第二行列出非t=8.458,df=469.595,P=0.000,小于0.05,从而最终得到的统计
结论按α=0.05水准。
拒绝H0不同性别的人群的教育水平是有差异的。
5.考察经验和当前薪金之间的数量关系,并建立二者的回归模型,预测当经验为
300时,相应的薪金应是多少?
选择“分析”到“回归”到“线性”
输入/移去的变量a
模型输入的变量移去的变量方法
1 经验(以月计)b. 输入
a. 因变量: 当前薪金
b. 已输入所有请求的变量。
由此图可知,放入模型的只有一个自变量,选择变量的方法为强行纳入模型的。
模型汇总
模型R R 方调整 R 方标准估计的误
差
1 .097a.009 .007 $17,012.353
a. 预测变量: (常量), 经验(以月计)。
Anova a
模型平方和df 均方 F Sig.
1 回归1310179340.33
2 1 1310179340.332 4.527 .034b 残差
136606316096.0
08
472 289420161.220
总计
137916495436.3
40
473
a. 因变量: 当前薪金
b. 预测变量: (常量), 经验(以月计)。
F=4.527,P<0.05,说明所建立的回归模型是具有统计学意义的,由于只有一个
变量,所以该自变量的回归系数是有统计意义的。
给出了模型的常数项a=35945.029以及自变量的偏回归系数b=-15.913及检验结果,可写出回归方程:
当前薪金Y=35945.029-15.913*经验X
所以,当经验=300时,预测当前薪金为31171元。
成绩评定:。