习题一(与第三章内容配套)
1.数据文件:《公司职工》
1)按照以下标准,给指定的变量观察值分组:
(1)变量:educ(受教育年限)
中学:educ≤12;大学: 12<educ≤16;研究生:educ≥17
(2)变量:age(年龄)
青年:age<40;中年:40≤age<60;老年:age≥60
(3)变量:salary(当前薪金)
低收入:salary≤20000;中收入:20000<salary≤40000;高收入:salary>40000 2)统计老、中、青年各组的人数及占全体职工的比率。
3)统计不同性别的职工中,高、中、低收入的人数,及占全体职工人数的比率。
4)在不同的受教育组中,按性别(gender)统计的不同职务(jobcat)的人数及占全体职工人数的比率。
5)同3),但还要统计每一组的平均当前薪金(salary)、最大当前薪金和最小当前薪金。
2.数据文件:《学生考试成绩》
1)按以下要求,将成绩score分为五等:优:score≥90;良:80≤score<90;中:70≤score<80;及格:60≤score<70;不及格:score<60。
2)按照以上五个等级,统计每一个等级的人数及占总体的比率:
(1)总体取全体参加考试的学生;
(2)总体取每一个班级;
(3)总体取男生及女生。
3)求全体参加考试学生的总平均成绩、每一班的平均成绩以及男、女生的平均成绩。
4)全体学生成绩的中位数是多少?男、女生成绩的中位数分别是多少?成绩在60分(含)以上的学生占全体学生的比率是多少?80%的学生成绩不低于多少分?每一班的最高分与最低分分别是多少?
5)在每一个班级中,分男、女生统计不同成绩等级的学生人数及每一等级的平均分、最高分与最低分。
答案:
1. 1)
1.2)
统计结果如下:
年龄组
频率百分比有效百分比累积百分比有效<40 274 57.8 57.8 57.8 40~60 133 28.1 28.1 85.9
>=60 67 14.1 14.1 100.0
合计474 100.0 100.0
1.3)
处理结果如下:
1.4)
分析结果:
报告当前薪金
1.5)
2.1)具体步骤见1.1)。
2.2).(1)具体步骤见1.2),结果如下:
成绩组
频率百分比有效百分比累积百分比有效>=90 29 19.0 19.0 19.0 80~90 44 28.8 28.8 47.7
70~80 33 21.6 21.6 69.3
60~70 29 19.0 19.0 88.2
<60 18 11.8 11.8 100.0
合计153 100.0 100.0
2.2).(2)
2.3)
分析结果如下
成绩* 班级
成绩
班级均值N
1021 74.16 38
1022 71.59 37
1023 79.81 37
1024 77.95 41
总计75.92 153
成绩* 性别
成绩
性别均值N
男69.43 63
女80.47 90
总计75.92 153
或者通过建立两个层在一张表上显示所有信息,其结果如下:
报告
2.4)(求中位数时老师讲的做法)
由此可见,全体学生成绩的中位数是79。
男生成绩的中位数是71,而女生成绩的中位数是82。
分析结果
报告
成绩
班级极小值极大值1021 33 100 1022 28 98 1023 48 97 1024 50 100 总计28 100
2.4)(原来自己做的)
求中位数也可以在Means中来统计(见上面的2.4)。
分析结果如下:
统计量
成绩
N 有效153
缺失0
中值79.00
成绩
频率百分比有效百分比累积百分比有效100 3 2.0 2.0 2.0
98 1 .7 .7 2.6
97 2 1.3 1.3 3.9
96 1 .7 .7 4.6
95 4 2.6 2.6 7.2
94 4 2.6 2.6 9.8
93 2 1.3 1.3 11.1
92 2 1.3 1.3 12.4
91 5 3.3 3.3 15.7
90 5 3.3 3.3 19.0
89 3 2.0 2.0 20.9
88 5 3.3 3.3 24.2
87 4 2.6 2.6 26.8
86 4 2.6 2.6 29.4
85 5 3.3 3.3 32.7
84 3 2.0 2.0 34.6
83 4 2.6 2.6 37.3
82 8 5.2 5.2 42.5
81 2 1.3 1.3 43.8
80 6 3.9 3.9 47.7
79 7 4.6 4.6 52.3
78 4 2.6 2.6 54.9
77 4 2.6 2.6 57.5
76 4 2.6 2.6 60.1
75 2 1.3 1.3 61.4
74 2 1.3 1.3 62.7
73 1 .7 .7 63.4
72 3 2.0 2.0 65.4
71 5 3.3 3.3 68.6
70 1 .7 .7 69.3
69 2 1.3 1.3 70.6
68 4 2.6 2.6 73.2
67 2 1.3 1.3 74.5
66 3 2.0 2.0 76.5
65 1 .7 .7 77.1
64 3 2.0 2.0 79.1
63 2 1.3 1.3 80.4
62 3 2.0 2.0 82.4
61 3 2.0 2.0 84.3
60 6 3.9 3.9 88.2
57 1 .7 .7 88.9
56 2 1.3 1.3 90.2
54 1 .7 .7 90.8
51 4 2.6 2.6 93.5
50 1 .7 .7 94.1
49 3 2.0 2.0 96.1
48 1 .7 .7 96.7
45 1 .7 .7 97.4
37 1 .7 .7 98.0
33 2 1.3 1.3 99.3
28 1 .7 .7 100.0
合计153 100.0 100.0
由以上的结果可以得出,全体学生成绩的中位数是79。
成绩在60分(含)以上的学生占全体学生的比率是88.2%。
80%的学生成绩大约不低于63分,也可以用割点来精确计算80%的学生成绩。
以下部分可以不看,自己做的。
要想得到男、女生成绩的中位数,需要对数据按性别进行拆分,然后再进行频率统计(可以用均值,参见上面2.4)。
处理结果如下(这里只截取了统计量的数据即可满足要求,没有截取成绩频率表):
统计量
成绩
男N 有效63
缺失0
中值71.00
女N 有效90
缺失0
中值82.00
由以上的数据可以知道男生成绩的中位数是71,女生成绩的中位数是82。
同样,可以对数据按班级进行拆分,然后再进行频率统计。
(老师讲的是按照均值方法来统计)
2.5)
总计41 135.54 165 115
总计男>=90 6 42.50 81 1
80~90 14 78.29 127 4
70~80 12 90.92 155 7
60~70 18 57.06 128 2
<60 13 54.23 129 10
总计63 66.25 155 1
女>=90 23 104.22 195 28
80~90 30 76.23 153 19
70~80 21 90.90 150 22
60~70 11 69.91 165 18
<60 5 92.60 140 26
总计90 86.94 195 18
总计>=90 29 91.45 195 1
80~90 44 76.89 153 4
70~80 33 90.91 155 7
60~70 29 61.93 165 2
<60 18 64.89 140 10
总计153 78.42 195 1
21 / 21。