第六章_调查资料的统计分析
2. 事后编码
对于开放式问题而言,只能在资料收集好之后, 再根据受访者的回答内容来决定不同答案的指定 编码。
编码的依据不应只是文字,更重要的是文字所反 映出来的被调查者的潜在意识。
所以对开放式问题的编码有一整套科学的方法与 操作程序。
事后编码程序
列出答案。将所有被访者提供的答案一一列出
6.2 描述性统计分析
6.2.1 列表 列表,即把调查资料按照一定的目的,用 表格形式展现出来 表的结构:标题、横标目、纵标目、数字。 表的种类:简单分组表(单因素列表)、 复合分组表(交叉列表)。 制作方法:制作应遵循科学、实用、简练、 美观原则。
简单列表(单因素列表)案例
消费者购物地点选择调查表
案例(变量次数分配的编制)
第一步:按从小到大的顺序排列数据 84、85、87、91、91、94、95、96、97、 99、101、101、103、105、105、105、106、 106、106、106、107、107、109、110、 111、111、118、119、121、128 第二步:将相同的数据归入同一组,并汇 总各组数值的个数
6.1.2 编码
编码是指对一个问题的不同回答进行分组和确定 数字代码的过程。
1.事先编码
大多数的问卷中大部分问题都是封闭式的,即已 经预先编码。这意味着对调查中一组问题的不同 数字编码已被确定,所有封闭式问题都是事先编 码的。
事先编码案例
1. 您每月生活费的主要来源是_____? A. 父母 B. 家教、兼职 C. 奖学金/助学金 D.其它 2. 您父母平均一个月给您的生活费是______? A. 500元以下 B. 500-800元 C. 800-1000元 D. 1000-1500元 E. 1500以上 3. 您每月实际消费是_____? A. 500元以下 B. 500-800元 C. 800-1000元 D. 1000-1500元 E. 1500以上 4. 你的消费习惯可以描述为_______? A. 事先做好消费计划再花钱 B. 以勤俭为本 C. 想花就花 D. 其它 (请注明)
6.2 描述性统计分析
描述性统计分析( Descriptive Analysis ) 指对被调查总体所有单位的有关数据进行整 理和计算综合指标等的加工处理,是用来描 述总体特征的统计分析方法。 市场调查分析中最常用的描述性统计分析, 主要包括对调查数据的分组分析、集中趋势 分析、离散程度分析和相对程度分析、指数 分析。
根据所使用分组标志的性质不同,可分为品质标 志分组(比如按性别、职业等分组)和数量标志 分组(比如按年龄、收入、人口、产量等分组)。
案例
我国各级各类型图书馆普遍使用的分类方法就是《中国图 书馆图书分类法》,简称“中图法”。《中图法》是我国 于1975年正式出版编制的一部大型综合性的图书分类法。 它采用五分法的分类体系,把图书资料所包括的知识内容 划分为"马克思主义 列宁主义 毛泽东思想"、"哲学"、" 社会科学"、"自然科学"和"综合性图书"五大基本部类。 社会科学 A 马列主义、毛泽东思想 B 哲学 C 社会科学总论 D 政治、法律 E 军事 F 经济 G 文化、科学、教育、体育 H 语言、文字 I 文学 J 艺术 K 历史、地理
案例
统计分组可以显示社会现象之间的依存关系
某地区粮食单位面积产量和施肥量的关系
每公顷化肥施用量 (千克) 116.25 133.50 145.50 153.75 163.50 粮食单位面积产量 (千克/公顷) 2827.5 3124.5 3396.0 3608.3 3484.0
统计分组标志的选择 标志指反映事物属性或特征的名称。 根据分组标志的不同性质,分组有不同的类型: 根据分组标志的数量的不同,可分为简单分组和 复合分组两类。
我国三次产业分类的从业人员构成情况 单位(%) 产业\年份 1993 1994 1995 1996 1997 第一 56.4 51.3 52.2 50.0 49.9 第二 22.4 22.7 23.0 23.5 23.7 第三 21.2 23.0 24.8 26.0 26.4 合计 100.0 100.0 100.0 100.0 100.0
周工资额(元)
84 85 87 91 94 95 96 97 99 101 103 105 106 107 109 110 111 118 119 121 128 合计
人数(次数)
1 1 1 2 1 1 1 1 1 2 1 3 4 2 1 1 2 1 1 1 1 30
案例(变量次数分配的编制)调查资料整理的基本步骤
设计和编制资料整理方案。这是保证统计资料的 整理有计划、有组织地进行的重要一步。资料的 整理往往不是整理一个或两个指标,而是整理多 个有联系的指标所组成的指标体系。
对原始资料进行审核。资料的审核是第一步,为 了保证质量必须进行严格的审核。
综合汇总调查项目,对原始资料进行分组、编码、 汇总和计算是关键。 对整理好的资料再进行一次审核,然后编制成一 个统计表,以表示社会经济现象在数量上的联系。
6.2.3描述性统计分析的内容
1、数据的集中趋势分析。对调查数据公布的数量规律性 中集中特征进行分析,是对被调查总体的特征进行准确描 述的重要前提。数据集中趋势分析的对象,包括数据的均 值(各类平均数)、中位数和众数。 均值是数据偶然性和随机性的一个特征值,反映了一些数 据必然性的特点。 中位数(Me)的确定可以以未分组资料为基础,也可由分 组资料得到。它同样不受到资料中少数极端值大小的影响。 在某些情况下,用中位数反映现象的一般水平比算术平均 数更具有代表性,尤其对于两极分化严重的数据,更是如 此。 众数(Mo)是总体中出现次数最多单位的标志值,也是测 定数据集中趋势的一种方法,克服了平均数指标会受数据 中极端值影响的缺陷。
信度与效度
信度是指对同一事物进行重复测量时,所得到的 结果的一致性程度,一致性程度越高则信度越高。 效度则是指一项测量能正确测出它所要测量的事 物的程度。 一份问卷如果无信度则一定无效度,有效度则一 定有信度;然而有信度不能保证有效度。
因此,在设计调查方案时要努力确保调查中的每 一个问题就是调查者想要的变量,而且这种变量 保持一定的一致性。
变量次数分配的编制 按数量标志编制次数分配,所形成的结 果称为变量次数分配。变量次数分配的编 制程序如下:
将原始资料顺序排列 将各个数据按其数值大小归入相应的组内 确定组数和组距(组中最大值与最小值差额) 确定组限(组的两个端点)
案例(变量次数分配的编制)
假设某企业30个非熟练工人的周工资额 (元)如下: 106、99、85、121、84、94、106、105、 110、119、101、95、91、87、105、106、 109、118、96、128、91、97、105、111、 111、107、103、101、107、106
单项变量分布数列
按日产量分组 (件) 25 26 27 28 29 30 合计 工人人数 (人) 10 20 30 50 40 30 180 比重 (%) 6 10 17 28 22 17 100
案例
组距变量数列
企业数 6 16 6 28 比重(%) 21.3 57.4 21.3 100.00
按计划完成程度分组 100以下 100—110 110以上 合计
案例(不等距分组的变量次数分配编制)
某地区人口年龄分配情况
按年龄分组 1岁以下 1~7岁 7~18岁 18~25岁 25~55岁 55岁以上 合计 人口数(万人) 2 12.2 24.0 14.8 34.2 16.3 103.5
某地区个人年收入额分配
按年收入额 各组所占百分比 分组(元) (% ) 0~5,000 23.9 5,000~10,000 34.8 10,000~15,000 20.1 15,000~45,000 17.28 45,000~75,000 1.74 75,000~105,000 0.88 105,000~135,000 0.81 135,000以上 0.48 合 计 100.00
总数 杭州百货大楼 银泰百货 不知道/未回答
300 144 146 10
6.2.2 绘图
统计绘图的种类:线图、条形图或称柱状 图、圆饼图、曲线图、直方图。 统计图的作用:
形象地表明事物总体结构。 表明统计指标不同条件下的对比关系。 反映事物发展变化的过程和趋势。 说明总体单位按某一标志的分布情况。 显示现象之间的相互依存关系。
6.1.3 调查资料的统计分类、分组
统计分类、分组,是指根据社会调查的目 的和要求,按照一定标志,将所研究的事 物或现象区分为不同的类型或组的一种整 理资料的方法。 分类、分组的作用: 可以找出总体内部各个部分之间的差异 可以深入了解现象总体的内部结构 可以显示社会现象之间的依存关系
案例
统计分组可以深入了解现象总体的内部结构:
问题:“您为什么选择海尔空调?” 列出所有答案:
1.节能环保 2.外形美观 3.价格公道 4.噪音低 5.空调效果好 6.性价比高 7.高科技 8.体积小 9.大品牌 10.邻居都用这个牌子 11.经常在广告中见到 12.没想过 13.不知道 14.没什么特别原因
根据回答分类来编码
1、质量、科技 1,4,5,7 3、价格实惠 3,6 5、不清楚 12,13,14 2、外形 4、大名牌 2,8 9,10,11
将有意义的答案列成频数分布表,并确定可以接受 的分组数