当前位置:文档之家› 社会调查方法与统计

社会调查方法与统计


中位数的位置
(n + 1)÷ 2 1)
n为数据个数
例题 5
调查5 调查5个学院的学生人数,按规模由小到大 以此为200人、300人、500人、800人、1000 以此为200人、300人、500人、800人、1000 人,求中位数。 解:
其中间位置为(5+1) 其中间位置为(5+1)÷ 2 = 3,即第三个学院 3,即第三个学院 所对应的数值500为中位数。 所对应的数值500为中位数。
列出累计频数后,我们从上往下找(或者从下往上找), 看看中间位置最先落在哪一累计频数内。
在本例中,无论按哪种方式寻找,中间位置75.5总是最先落入人数 为50的那一行。这一行对应的19岁即所求中位数。
4. 平均数与中位数的比较
(1)平均数对数据总体的描述和反映,在一般情 况下比中位数更加全面和准确。
当数据为偶数个时,中位数的位置处于中 间两个数值之间,而没有直接对应的数值。 此时一般以中间这两个数值的平均数作为 中位数。
例题 6
调查6 调查6个学院的学生人数,按规模由小到大 以此为200人、300人、500人、800人、1000 以此为200人、300人、500人、800人、1000 人、1200人,求中位数。 人、1200人,求中位数。 解:
如果是单值分组资料,那么,计算平均数时首先 要将每一个变量值乘以所对应的频数f 要将每一个变量值乘以所对应的频数f,得出各 组的数值之和,然后将各组的数值之和全部相加, 最后除以单位总数(即各组频数之和)。
1 X = ΣfX C n
例题 3
调查某年级150名学生 调查某年级150名学生 的年龄,得到表 9-5 所 示的结果,求平均年 龄。
是指用一个典型值或代表值来反映一组数据的一般水 平,或者说反映这组数据向这个典型值集中的情况。
常见的集中趋势分析
平均数(均值) 众数 中位数
1. 平均数
平均数(Mean) 平均数(Mean)
总体各单位数值之和除以总体单位数目所得之商。
计算公式
N
X1 + X2 +L+ X N i=1 X= = N N
表 9-9 200户家庭资料
家庭规模 2人 3人 4人 5人 合计
户数 10 120 50 20 200
3. 异众比率(Variation Ratio) 异众比率(Variation Ratio)
定义
异众比率是指一组数据中非众数的次数相对于 总体全部单位的比率。
意义
是指众数所不能代表的其他数值(即非众数的 数值)在总体中的比重。
中间位置为(6+1) 中间位置为(6+1)÷ 2 = 3.5 ,即中间位置处 在第三个和第四个学院之间,中位数所对应的 数值为(500+800) 数值为(500+800)÷ 2 = 650 人。
单值分组数据的中位数
当资料为单值分组数据时,也是先求出数 据组的中间位置,然后再找出其对应值。 以例题3 以例题3 表9-5数据为例
计算平均数时要求用到数据中所有的数值,而求中位 数时只用到数值的相对位置,因而平均数比中位数利 用了更多的有关数据的信息。
(2)平均数非常容易受到极端值的变化的影响, 而中位数则不会受到这种影响。
当样本中数据值的分布是高度偏斜的,即在一个方向 上有较多的极端个案,中位数一般总是比平均数更适 合一些。
中文系:82- 中文系:82-78 = 4(分) 4(分) 数学系:95- 数学系:95-65 = 30(分) 30(分) 英语系:100- 英语系:100-35 = 65(分) 65(分)
2. 标准差(Standard Deviation) 标准差(Standard Deviation)
定义
一组数据对其平均数的偏差平方的算术平均数 的平方根。
频率分布表与频数分布表
频数表是不同类别在总体中的绝对数量分布,而频率 分布表则是不同类别在总体中的相对数量分布(相对 比重)。
正是由于这一特点,频率分布表除具备频数分布表的优点外, 还有一个十分重要的优点,这就是它十分方便地用于不同总体 或不同类别之间的比较。因此,这种分布表的应用更为普遍。
表 9-2 某班学生父亲职业的频率分布表
即中间位置落在第75个与第76个数值之间。 即中间位置落在第75个与第76个数值之间。
为了找到这个数值,需要先列出累计频数。 累计频数的计算既可以从上到下,也可以 从下到上(见表9 从下到上(见表9-7中的第三、第四两栏)。
表 9-7 例题3的累计频数
年龄(岁) 17 18 19 20 21 22 合计 人数(频数) 10 25 50 40 20 5 150 累计频数↓ 10 35 85 125 145 150 累计频数↑ 150 140 115 65 25 5
因此,当异众比率越大,即众数所不能代表的其他 数值在总体中的比重越大时,众数在总体中所占的 比重自然就越小,这样,众数的代表性就越小。
3. 中位数(Median) 中位数(Median)
中位数(Median)的定义 中位数(Median)的定义
把一组数据按值的大小顺序排列起来,处于中央位置 的那个数值就叫中位数。
中位数的适用范围
中位数所描述的是定序变量以上层次的变量。
中位数的含义
整个数据中,有一半数据的值在它之上(比它大), 另一半数据的值在它之下(比它小)。
表 9-6 某大学100名学生勤工助学收入的分布 某大学100名学生勤工助学收入的分布
收入(元) 100~199 200~299 300~399 400~499 500~599 合计 学生数(人) 10 10 40 20 20 100 组中值 150 250 350 450 550 f X 1500 2500 14000 9000 11000 38000
(3)对于抽样调查来说,平均数是一种比中位数 更为稳定的量度,它随样本的变化比较小。
即对于从同一总体中、采用同一方式抽出的、同样规 模的不同样本来说,它们的平均数相互之间的差别, 往往比它们的中位数相互之间的差别要小一些。
(4)与中位数相比,平均数比较容易进行算术运 算。
这是因为,平均数所要求的是定距层次以上的变量, 而中位数所要求的是定序层次以上的变量。
例题 3
调查某年级150名学生 调查某年级150名学生 的年龄,得到表 9-5 所 示的结果,求平均年 龄。
表 9-5 某年级学生的年龄分布
年龄(岁) 17 18 19 20 21 22 合计
人数 10 25 50 40 20 5 150
先由公式计算中间位置:
(n + 1)÷ 2 = (150 + 1)÷ 2 = 75.5 1) 1)
社会调查方法与统计
张凯 zhangkai798@ 天津师范大学政治与行政学院 应用社会学系
第九讲 资料的统计分析
本讲内容安排
一、频数分布与频率分布 二、集中趋势分析 三、离散趋势分析
一、频数分布与频率分布
1. 频数分布
频数分布(frequency distribution) 频数分布(frequency distribution)
表 9-3 某班学生年龄的频数分布
年龄(岁) 17 18 19 20 21 合计 学生人数 1 4 2 2 1 10
表 9-4 某班学生年龄的频率分布
年龄(岁) 17 18 19 20 21 合计 比例(%) 10 40 20 20 10 100(n=10)
二、集中趋势分析
集中趋势分析(Central 集中趋势分析(Central Tendency Analysis) Analysis)
表 9-5 某年级学生的年龄分布
年龄(岁) 17 18 19 20 21 22 合计
人数 10 25 50 40 20 5 150
(2)组距分组数据的均值
组中值
组中值=(组上限+组下限)÷ 组中值=(组上限+组下限)÷ 2
当组中值为小数时,通常采取四舍五入的办法将其 化为整数后再计算。
例题 4
调查某大学100名学生勤工助学的收入,得到表9 调查某大学100名学生勤工助学的收入,得到表9-6 所示的资料,计算他们的平均收入。
是指一组数据中取不同值的个案的次数分布情况,它 一般以频数分布表的形式表达。
频数分布表的作用
一是简化资料,将调查所得到的一长串原始数据,以 一个十分简洁的统计表反映出来。 二是从频数分布表中,我们可以更清楚地了解调查数 据的众多信息。
表 9-1 某班学生父亲职业的频数分布表
某班有20名学生,我们通 过对他们的父亲的职业情 况进行调查,得到下列结 果:工人、工人、工人、 工人、干部、干部、干部、 干部、干部、干部、教师、 教师、教师、商人、商人、 商人、商人、商人、农民、 农民。
例题 1
某班有10名学生,其年龄如下:20岁、19岁、 某班有10名学生,其年龄如下:20岁、19岁、 18岁、19岁、18岁、20岁、21岁、17岁、18 18岁、19岁、18岁、20岁、21岁、17岁、18 岁、18岁。请做出关于该班学生的年龄分布 岁、18岁。请做出关于该班学生的年龄分布 的频数表和频率表。
离散趋势分析 (Dispersion Tendency Analysis) Analysis)
离散趋势分析是指用一个特别的数值来反映一组 数据相互之间的离散程度。
它与集中趋势分析一起,分别从两个不同的侧面描述 和揭示一组数据的分布情况,共同反映出资料分布的 全面特征。
常见的离散量数统计量有全距、标准差、异众比 率、四分位差等。
某班有20名学生,我们通 过对他们的父亲的职业情 况进行调查,得到下列结 果:工人、工人、工人、 工人、干部、干部、干部、 干部、干部、干部、教师、 教师、教师、商人、商人、 商人、商人、商人、农民、 农民。
相关主题