当前位置:文档之家› SPSS数据分析报告

SPSS数据分析报告

SPSS期末报告关于员工受教育程度对其工资水平的影响统计分析报告课程名称:SPSS统计分析方法*名:***学号:**********所在专业:人力资源管理所在班级:三班目录一、数据样本描述 (1)二、要解决的问题描述 (1)1 数据管理与软件入门部分 (1)1.1 分类汇总 (1)1.2 个案排秩 (1)1.3 连续变量变分组变量 (1)2 统计描述与统计图表部分 (1)2.1 频数分析 (1)2.2 描述统计分析 (1)3 假设检验方法部分 (1)3.1 分布类型检验 (2)3.1.1 正态分布 (2)3.1.2 二项分布 (2)3.1.3 游程检验 (2)3.2 单因素方差分析 (2)3.3 卡方检验 (2)3.4 相关与线性回归的分析方法 (2)3.4.1 相关分析(双变量相关分析&偏相关分析) (2)3.4.2 线性回归模型 (2)4 高级阶段方法部分 (2)三、具体步骤描述 (3)1 数据管理与软件入门部分 (3)1.1 分类汇总 (3)1.2 个案排秩 (4)1.3 连续变量变分组变量 (4)2 统计描述与统计图表部分 (5)2.1 频数分析 (5)2.2 描述统计分析 (7)3 假设检验方法部分 (8)3.1 分布类型检验 (8)3.1.1 正态分布 (8)3.1.2 二项分布 (10)3.1.3 游程检验 (10)3.2 单因素方差分析 (12)3.3 卡方检验 (13)3.4 相关与线性回归的分析方法 (14)3.4.1 相关分析 (14)3.4.2 线性回归模型 (15)4 高级阶段方法部分 (17)4.1 信度 (18)4.2 效度 (18)一、数据样本描述分析数据来自于“微盘——SPSS数据包data02-01”。

()本次分析的数据为某公司474名职工状况统计表,其中共包含11个变量,分别是:id(职工编号),gender(性别),bdate(出生日期),edcu(受教育水平程度),jobcat(职务等级),salbegin (起始工资),salary(现工资),jobtime(本单位工作经历<月>),prevexp(以前工作经历<月>),minority(民族类型),age(年龄)。

通过运用SPSS统计软件,对变量进行统计分析,以了解该公司职工总体状况,并分析职工受教育程度、起始工资、现工资的分布特点及相互间的关系。

二、要解决的问题描述1 数据管理与软件入门部分1.1 分类汇总以受教育水平程度为分组依据,对职工的起始工资和现工资进行数据汇总。

1.2 个案排秩对受教育水平程度不同的职工起始工资和现工资进行个案排秩。

1.3 连续变量变分组变量将被调查者的年龄分为10组,要求等间距。

2 统计描述与统计图表部分2.1 频数分析利用了某公司474名职工基本状况的统计数据表,在性别、受教育水平程度不同的状况下进行频数分析,从而了解该公司职工的男女职工数量、受教育状况的基本分布。

2.2 描述统计分析以职工受教育水平程度为依据,对职工起始工资进行描述统计分析,得到它们的均值、标准差、偏度峰度等数据,以进一步把握数据的集中趋势和离散趋势。

3 假设检验方法部分3.1 分布类型检验3.1.1 正态分布分析职工的现工资是否服从正态分布。

3.1.2 二项分布抽样数据中职工的性别分布是否平衡。

3.1.3 游程检验该样本中的抽样数据是否随机。

3.2 单因素方差分析把受教育水平和起始工资作为控制变量,现工资为观测变量,通过单因素方差分析方法研究受教育水平和起始工资对现工资的影响进行分析。

3.3 卡方检验职工的起始工资水平和现工资水平与其受教育程度之间是否存在关联性。

3.4 相关与线性回归的分析方法3.4.1 相关分析(双变量相关分析&偏相关分析)对受教育程度和现工资两个变量进行相关性分析。

3.4.2 线性回归模型建立用受教育程度预测现工资水平的回归方程4 高级阶段方法部分对该样本数据进行信效度检测三、具体步骤描述1 数据管理与软件入门部分1.1 分类汇总以受教育水平为分组依据,对职工的起始工资和现工资进行数据汇总。

图 1.1分类汇总数据由图1.1所示,受教育等级以年为单位划分可分为8年、12年、14年等图中所示10个等级。

以等级为8年为例,现工资均值为24399.06美元,起始工资均值为13064.15美元,统计量为53人。

经比较可知,教育年限为12年和15年的职工在公司中占大多数,教育年限为20年和21年的职工在公司中的初始工资平均水平较高,但教育年限为19年的职工现工资平均水平较高。

1.2 个案排秩对受教育水平程度不同的职工起始工资和现工资进行个案排秩。

表 1.2-1 现工资水平个案排秩统计量統計資料Rank of salary by educN有效遺漏474平均數中位數標準偏差範圍最小值最大值60.4346046.5000050.975992189.0001.000190.000表 1.2-2 初始工资水平个案排秩统计量統計資料Rank of salbegin by educN有效遺漏474平均數中位數標準偏差範圍最小值最大值60.4346047.5000050.865407189.0001.000190.0001.3 连续变量变分组变量将被调查者的年龄分为5组。

根据表1.3所示,该公司474名职员年龄几乎全部在33岁以上、73岁以下,年龄层分布集中在已有工作经验的人当中,其中33~43岁的员工为该公司的主体。

2 统计描述与统计图表部分2.1 频数分析利用了某公司474名职工基本状况的统计数据表,在性别、受教育水平程度不同的状况下进行频数分析,从而了解该公司职工的男女职工数量、受教育状况的基本分布。

由表2.1-1可知,在该公司的474名职工中,有216名女性,258名男性,男女比例分别为45.6%和54.4%,该公司职工男女数量差距不大,男性略多于女性。

下面对该公司员工受教育程度进行频数分析:表 2.1-2 职工受教育程度频数统计表次數百分比有效的百分比累積百分比有效8121415161718195319011.2 11.2 11.240.1 40.1 51.36 1.3 1.3 52.5116 24.5 24.5 77.059 12.4 12.4 89.511 2.3 2.3 91.89 1.9 1.9 93.727 5.7 5.7 99.420 2 .4 .4 99.821 1 .2 .2 100.0 總計474 100.0 100.0图 2.1-2 职工受教育程度频数分布直方图表2.1-2及其直方图说明,被调查的474名职工中,受过12年教育的职工是该组频数最高的,为190人,占总人数的40.1%,其次为15年,共有116人,占总人数的24.5%。

且接受过高于20年的教育的人数只有1人,比例很低。

2.2 描述统计分析以职工受教育水平程度为依据,对职工起始工资进行描述统计分析,得到它们的均值、标准差、偏度峰度等数据,以进一步把握数据的集中趋势和离散趋势。

(由于输出结果较长,为了便于解释,仅截取职工受教育水平年限为8年的分析结果)图 2.2-1 职工起始工资描述统计表(部分)图 2.2-2 职工起始工资描述统计直方图(部分)图2.2给出的就是以受教育年限为8年时职工起始工资的描述统计,由此得出结论如下:(1)集中趋势指标:由图2.2-1可知,职工起始工资均值为$13064.15,5%截尾均数为$13016.35,中位数为$13050.00,三者差异较大,说明数据分布的对称性较差。

(2)离散趋势指标:起始工资方差为5799170.900,其平方根即标准差为2408.147,样本中极小值为$9750,极大值为美元18750,两者之差为全距(范围)$9000,中间一半样本的全距为四分位间距$4875。

(3)参数估计:职工起始工资的标准误差为$330.784,相应的总体均数95%可信区间为$12400.38-$13727.92。

(4)分布特征指标:根据描述统计数据可知,该样本数据中偏度为0.148>0,曲线右偏;峰度为-1.219<3,曲线较为平缓(该结论也可从图2.2-2的直方图及其曲线中看出)。

3 假设检验方法部分3.1 分布类型检验3.1.1 正态分布分析职工的现工资是否服从正态分布。

H0:职工的现工资服从正态分布H1:职工的现工资不服从正态分布α=0.05表 3.1.1 职工现工资正态分布检验结果單一樣本 Kolmogorov-Smirnov 檢定Current SalaryN 474常態參數a,b平均數$34,419.57 標準偏差$17,075.661最極端差異絕對.208正.208負-.143 測試統計資料.208漸近顯著性(雙尾).000ca. 檢定分配是常態的。

b. 從資料計算。

c. Lilliefors 顯著更正。

图 3.1.1 K-S检验详细模型输出结果如表3.1.1所示:P=0.000P<α接受H1,认为职工的现工资统计量不服从正态分布。

3.1.2 二项分布抽样数据中职工的性别分布是否平衡。

H0:抽样数据中职工性别比例无差异H1:抽样数据中职工性别比例有差异α=0.05P=0.06P>α接受H0,认为抽样数据中职工性别比例无差异。

3.1.3 游程检验该样本中的抽样数据是否随机(检测数据均以均值为分割点)。

(1)性别:H0:抽样数据中性别序列为随机序列H1:抽样数据中性别序列不为随机序列α=0.05表 3.1.3-1 性别序列游程检验連檢定gender測試值a.46觀察值 < 檢定值258觀察值 >= 檢定值216總箱數474連個數110Z -11.692 漸近顯著性(雙尾).000 a. 平均數图 3.1.3-1 性别序列游程检验详细模型输出P=0.000P<α接受H1,认为样本数据中性别序列不是随机序列。

(2)年龄:H0:抽样数据中年龄序列是随机序列H1:抽样数据中年龄序列不是随机序列α=0.05表 3.1.3-2 年龄序列游程检验结果連檢定Years測試值a47.14觀察值 < 檢定值298觀察值 >= 檢定值175總箱數473連個數196Z -2.519 漸近顯著性(雙尾).012 a. 平均數图 3.1.3-2 年龄序列游程检验详细模型输出结果P=0.012P<α接收H1,认为年龄序列不是随机序列。

3.2 单因素方差分析把受教育水平和起始工资作为控制变量,现工资为观测变量,通过单因素方差分析方法研究受教育水平和起始工资对现工资的影响进行分析。

(1)起始工资对现工资的影响分析H0:认为起始工资对现工资没有显著影响H1:认为起始工资对现工资有显著影响α=0.05表 3.2-1 起始工资对现工资的影响分析结果變異數分析Current Salary平方和df 平均值平方 F 顯著性群組之間121986603521.73689 1370635994.626 33.040 .000在群組內.6 93.528 總計 6.340 473P=0.000P<α接受H1,认为起始工资对现工资有显著影响。

相关主题