当前位置:
文档之家› 社会调查研究方法——统计分析
社会调查研究方法——统计分析
(3)统计分析有一套专门的方法和技术 随着大数据时代的来临,数据分析技术显得尤为重要 ,正如某人所言“大数据时代不会数据分析,就等于慢性 自杀”。 SPSS作为当今世界三大权威统计软件之一,以其窗口 式、菜单式操作、无需编程、操作简单、图像完美等表现 ,占据着数据分析市场80%的份额。SPSS是一个非专业统 计人员处理专业统计学数据的最佳选择。
四、SPSS统计绘图功能详解
相比Excel, SPSS的绘图更为美 观、强大。下方的其 他菜单项是我们最为 常用的普通统计图, 具体来说有:
1、散点图是各种统计图中比较简单的一种,共分为simple、 matrix(以矩阵的形式显示多个变量间两两的散点图)、overlay (将多个变量间两两的散点图同时做在一张图上)和3D(将X、Y、 Z三个变量间的相关散点图做在一个立体空间中)四种,其中需要 解释的比较特殊的内容有:
五、信度与效度分析
信度和效度分析是问卷分析的第一步,也是检验该问卷是否合格的标 准之一,所以,我们在做问卷调查的时候第一步就要进行信度和效度的分 析,才能确保我们的问卷有意义。
信度(Reliability)即可靠性,是指使用相同指标或测量工具重复测 量相同事物时,得到相同结果的一致性程度。一个好的测量工具,对同一 事物反复多次测量,其结果应该始终保持不变才可信。
信度分析是:“分析”——“度量”——“可靠性分析”,把所有主 观题选到:“项目”中,确定即可,得出总的信度。把统一维度的题目选 中,得出先关维度的信度。
具体步骤:分析——度量——可靠性分析
结果分析:
分析各个维度和总量的信度后,将它们列出一个表格,其 中每个维度的a信度系数都大于0.7,说明该量表信度较好,符 合问卷调查。
2、准则效度分析
准则效度又称为效标效度或预测效度。准则效度分析是根据已经得到确定 的某种理论,选择一种指标或测量工具作为准则(效标),分析问卷题项与准 则的联系,若二者相关显著,或者问卷题项对准则的不同取值、特性表现出显 著差异,则为有效的题项。评价准则效度的方法是相关分析或差异显著性检验。 在调查问卷的效度分析中,选择一个合适的准则往往十分困难,使这种方法的 应用受到一定限制。
(3)分布形态的分析
(a)偏度:偏态是对数据分布对称性的描述,测度偏态的统计量是偏度。 如果一组数据的分布是对称的,则偏度等于0;如果偏度明显不等于0,表明分 布是非对称的。
(b)峰度:峰态是对数据分布平峰或尖峰程度的描述,测度峰态的统计量 是峰度。峰度通常是与标准正态分布相比较而言的。若一组数据服从标准正态分 布,则峰度的值等于0;若峰度的值明显不等于0,则表明分布比正态分布更平 或更尖。
目前最常用的是Alpha信度系数,一般情况下我们主要考虑量表的内 在信度——项目之间是否具有较高的内在一致性。通常认为,信度系数应 该在0~1之间,如果量表的信度系数在0.9以上,表示量表的信度很好; 如果量表的信度系数在0.8~0.9之间,表示量表的信度可以接受;如果量 表的信度系数在0.7~0.8之间,表示量表有些项目需要修订;如果量表的 信度系数在 0.7以下,表示量表有些项目需要抛弃。
直方图用于观察某个变 量的分布情况,如果选择了 display normal curve复选 框,则会同时做出一条当前变 量理想状况的正态分布曲线来, 和该曲线相比,你就可以知道 变量的实际分布究竟差了多远。
3、P-P图和Q-Q图都是用来观察变量是否服从正态分布的; 质量控制图则用来观察个体值是否有超过正常值范围的情况出 现;箱式图的作用和它类似,只是换了一种表达方式;其余的 几种图几乎都是用与时间序列模型的。
二、概念
SPSS的全称是:Statistical Program for Social Sciences,即社会科学统计程序。
作为统计分析工具,理论严谨、内容丰富,数据 管理、统计分析、趋势研究、制表绘图、文字处理等 功能,几乎无所不包。
三、几种常用的SPSS分析
SPSS常用的绘图功能简介 信度与效度分析 描述性统计分析 相关分析 主成分分析
然后相关系数选择Pearson相关系 数,也可以选择其他两个,这个只是 统计方法稍有差异,一般不性分析结果,可以看到X和Y的相 关性系数为0.766,对应的显著性 为0.076,如果设置的显著性水平 位0.05,则未通过显著性检验,即 认为虽然两个变量总体趋势有一 致性,但并不显著。
社会调查研究方法——统计分析
汇报人:殷文文 日期:2016.12.23
一、统计分析概述
1、定义 统计分析就是运用统计学方法对调查得到的数据资 料进行定量分析,以揭示事物内在的数量关系、规律和 发展趋势的一种资料分析方法。
2、统计分析的作用
(1)统计分析的方法提供一种清晰精确的形式化语言, 对资料进行简化和描述
七、相关分析
相关性是指两个变量之间的变化趋势的一致性,如果两个变量变化趋势一致, 那么就可以认为这两个变量之间存在着一定的关系(但必须是有实际经济意义的 两个变量才能说有一定的关系)。;一般地,|r|>0.95 存在显著性相关; ·|r|≥0.8 高度相关;0.5≤|r|<0.8 中度相关;0.3≤|r|<0.5 低度相关; ·|r|<0.3 关系极弱,认为不相关
Set marks by框:选入一个标记变量,根据该变量取致的不同 对同一个散点图中的各点标以不同的颜色(或形状),例如在数据 cars中我们以horse和weight做图,如果用orgion的大小来做 marks,则两次做出的图如下:
没有mark变量时的情况
用orgion做mark变量时的情况
2、直方图
(1)统计分析要以定性分析为基础 在定性分析的基础上进行统计分析是保证正确使用统 计分析的必要条件。这是因为: A、统计分析是根据数据资料进行的,而社会调查中 的数据不是抽象的数字而是反映了事物属性的统计指标。 定性分析要为定量分析规定方向,划分范畴。 B、统计分析是依据一定公式计算的,公式的选择依 赖于一定的理论知识、专业知识和必要的经验。 事实上在定量分析开始之前已经通过定性分析,从理 论和经验上判明了事物之间的联系,决定了要采用的公式 。
3、结构效度分析
结构效度是指测量结果体现出来的某种结构与测值之间的对应程度。结构
效度分析所采用的方法是因子分析。有的学者认为,效度分析最理想的方法是利 用因子分析测量量表或整个问卷的结构效度。因子分析的主要功能是从量表全部 变量(题项)中提取一些公因子,各公因子分别与某一群特定变量高度关联,这 些公因子即代表了量表的基本结构。通过因子分析可以考察问卷是否能够测量出 研究者设计问卷时假设的某种结构。在因子分析的结果中,用于评价结构效度的 主要指标有累积贡献率、共同度和因子负荷。累积贡献率反映公因子对量表或问 卷的累积有效程度,共同度反映由公因子解释原变量的有效程度,因子负荷反映 原变量与某个公因子的相关程度。在结束本文时应再次强调,为了提高调查问卷 的质量,进而提高整个研究的价值,问卷的信度和效度分析绝非赘疣蛇足,而是 研究过程中必不可少的重要环节。
相关性分析也是常用的统计方法,用SPSS统计软件操作起来也很简单,具体 方法步骤如下:
选取在理论上有一定关系的两个变量,如 从总体上来看,X和Y的趋势有一
用X,Y表示,数据输入到SPSS中。
定的一致性
为了解决相似性强弱用SPSS进 打开双变量相关对话框,将X和Y选中 行分析,从分析-相关-双变量。 导入到变量窗口。
(2)统计分析方法必须和其他分析方法结合运用 统计分析方法还必须和其他分析方法结合运用才能 更好地发挥作用。其原因是:
A、数量关系只是客观事物存在的诸种关系的一种, 而不是全部。统计分析方法不是万能的,它有自身独特 的长处,也有无法克服的局限性,它不能代替其他分析 方法。
B、统计分折方法能够帮助发现社会现象中不易察觉 的规律,但对规律的解释要借助于有关学科的理论。
效度(Validity)即有效性,是衡量综合评价体系是否能够准确反映评价 目的和要求。是指测量工具能够测出其所要测量的特征的正确性程度。效度越 高,即表示测量结果越能显示其所要测量的特征,反之,则效度越低。常用于 调查问卷效度分析的方法主要有以下几种。
1、单项与总和相关效度分析
这种方法用于测量量表的内容效度。内容效度又称表面效度或逻辑效度, 它是指所设计的题项能否代表所要测量的内容或主题。对内容效度常采用逻辑 分析与统计分析相结合的方法进行评价。逻辑分析一般由研究者或专家评判所 选题项是否“看上去”符合测量的目的和要求。统计分析主要采用单项与总和 相关分析法获得评价结果,即计算每个题项得分与题项总分的相关系数,根据 相关是否显著判断是否有效。若量表中有反意题项,应将其逆向处理后再计算 总分。
统计学的理论基础是数理统计学。数理统计学是数学的一个分支, 由一系列的公理、定理以及严格证明来组成。
描述性统计分析
数据的描述性分析即是从数据出发概括数据特征,主要包括数据的位置特 性、分散性、关联性等数字特征和反映数据整体结构的分布特征,它是数据分 析的第一步,也是对数据进行更进一步分析的基础。描述性统计分析主要包括 以下几个方面:
集中趋势的描述指标 (a)算术平均值 (b)几何平均值 (c)众数 (d)中位数
描述性统计分析
(2)离中趋势分析
数据的离散程度是数据分布的另一个重要特征,是指各变量值远离中心值 的程度,因此也叫离中趋势。
离中趋势的描述指标 (a)极差:也称全距,是一组数据的最大值和最小值的差。 (b)四分位数:处在数据一半位置的观测值被称为中位数,则处在数据的 25%和75%位置的观测值分别叫做下十分位数(Q1)和上四分位数(Q3), 四分位差即为(Q3-Q1)。 (c)方差与标准差:方差是各变量值与其均值的平均离散程度,标准差为 方差的平方根。(标准差越大,表示分布越分散;而标准差越小,表示分布越集 中。 )
(2)点击“旋转”,设置如下:
(3)点击“选项”,设置如下: