样本统计方法一般分为两个大的分支—参数统计和非参数统计。
非参数统计方法主要有:一是卡方拟合度检验(大众媒介研究者经常比较某一现象所观察到的发生频次和其期望值或假设的发生频次,卡方(X的平方)是一个表示期望值和观察值之间关系的值)。
其局限性在于变量必须是定类或者定序测量的。
二是交叉表分析,可以同时检验两个或者更多的变量。
参数统计常用于定距或定比数据。
一是t检验,二是方差分析;三是相关性统计分析。
T分布在抽样分布和样本分布之间架起了一座桥梁,是借助于颐和总显著性检验来实现的,成为“t检验”。
t检验又称“均值检验”,用以计算样本均值是否不同于总体均值、零或另一样本均值。
可分为三种类型:一是检验样本均值是否不同于其总体均值。
二是检验一个样本均值是否与另一个样本均值不同(独立样本t检验)。
三是重复测量的t检验—当相比较的两组样本以某种相联系的方式重复(相同的被试在不同时间段的结果检验)。
方差分析(ANOV A)——当实验涉及机组的比较时适用的统计方法。
它是均值检验的一种自然延伸,更强调样本组内与组间的变化而不是样本组均值。
ANOV A将发生在因变量上的变化分为由自变量作用的方差(称为被假设方差)和不被解释的方差(称为误差或剩余方差)。
“被解释”方差成为“主效应”。
ANOV A应用F分布而非t分布。
多因子方差分析——任何有两个或更多个自变量的ANOV A可以是多因子ANOV A,测量其“交互效应”。
相关检验——不同于t检验的均值检验,相关是一种“关联性”测量。
相关测量一个变量值的改变与另一个变量值改变的关联程度。
相关的显著性是指,系统性变化是否又非偶然因素引起的;换言之,相关系数是否显著大于零。
最常见的相关检验是皮尔逊积矩相关系数。
例3:在某次的新闻节目收视情况调查中,总体为某市12岁以上的居民。
有效样本男性为240人,平均每天收视时间31.5分钟,标准差12分钟;样本中女性180人,平均每天收视时间26.3分钟,标准差19分钟,请问总体中男女居民的新闻节目收视时间有无差异?原假设H0:总体中没有差异:H0:u1=u2;H1:u1>u2, u1<u2,涉及两侧2倍概率案例8:人际印象效果测量。
概念的操作化:1目标:将概念转化为变量2概念:对事物的抽象定义3变量:概念所对应的具有操作定义的量4过程:操作定义的步骤—步骤1:将变量分解为多个维度(dimension),步骤2:每个维度选择一组指标(indicator)来衡量。
人际印象效果可以划分为哪些维度:维度1:印象的鲜明度;维度2:印象的全面度;维度3:印象的好感度;维度4:印象的失真度。
变量的测量工具—量表(scale)、问卷(questionnaire)(量表能将变量的层次提升到定比和定距层面,而问卷只能局限于定类和定序层面)常见成熟量表:人格量表、智力量表、职业倾向量表。
量表的分类:自陈式量表:被试对自身情况作出判断并填写;评定式量表:被试对目标他人作出判断并填写;里克特量表(Likert Scale);语义差异量表(Semantic Differential Scale)。
量表的选择:保证效度信度(成熟量表)一定程度上保证效度信度(改编量表)基本无法保证效度信度(自编量表)案例9:NEO五因素人格量表Neuroticism(情绪性)Extraversion(外向性)Openness(开明性)Agreeableness(宜人性)Conscientiousness(严谨性)NEO各维度的测量指标情绪性(N):焦虑度、抑郁度、自信度;外向性(E):乐群度、热情度、交际反应性;开明性(O):想象力、行动力、观念开放度;宜人性(A):温和度、信任度、利他性;严谨性(C):条理性、审慎度、自律性严格的量表编制流程:清楚地决定你要测量什么;选择量表的形式(里克特、语义差异等);建立一个题项库;征求专家评价及建议;考虑是否加入某些特殊测试题项;小样本试测;评估题项的适合度并筛选题项;优化量表长度质性资料收集方法一:访谈(一)访谈计划的制订1访谈的分类:结构式访谈(structural interview)无结构式访谈(non-structural interview)2、在制订访谈计划的过程中,通常研究者需要明确这样几个问题:为什么通过访谈来收集资料?怎样进行访谈?访谈的对象是谁?什么时间以及在何处进行访谈?3、为什么通过访谈来收集资料?把握内心:企图对个人动机、态度、价值观念、思想等无法直接观察的问题进行把握。
挖掘细节:对整个研究对象的故事细节缺乏了解。
集中焦点:需要搜寻和集中一些问题的焦点以便为量化研究做准备。
4、怎样进行访谈?三轮访谈序列(the series of three interviews)第一轮:再现生活经历:探寻被访者获得的生活经历及其背景;第二轮:挖掘经历细节:让被访者在其所处背景中还原(重构)经历的细节;第三轮:反思经历意义:鼓励和引导被访者反思其经历对其自身的意义。
5、访谈的对象是谁?“找熟人”的问题:问题1:熟人之间可能存在利害相关性,以致损害研究者与被访者之间的平等关系,从而使得被访者在谈论话题的时候产生种种顾忌,导致研究者获取的信息可靠性受到影响。
问题2:熟人之间(尤其是朋友之间)有可能认为自己能够很好地理解对方的想法,以致于削弱对经历的挖掘和意义的反思。
6、目的性抽样(purposive sampling):典型案例抽样(typical case sampling)极端/异常案例抽样(extreme/deviant sampling)关键案例抽样(critical case sampling)最大变异性抽样(maximum variation sampling)7、被访者筛选过程中可能出现的问题:不愿意参与访谈的人—通常还是不宜勉强选为被访者,因为这样的人即便被说服后参与了访谈,可能在访谈中仍然处于一种对抗和抵触的状态,造成对整个研究的不利影响。
别有企图而特别想要参与访谈的人—研究者也必须谨慎。
特别想要对研究者进行表达的被访者很可能不能给予研究者自然状态下的信息。
8、被访者的数量:两个判断标准:对象涵盖面:已选取的被访者是否足以涵盖研究所需要考察的人群中不同特征的人。
信息饱和度:通过访谈,研究者是否已经听到了大量重复信息,或者说已几乎不再可能获取9、什么时间以及在何处进行访谈?访谈时间:有学者提出了90分钟的访谈长度。
建议根据具体情况而定。
访谈间隔:3天——1周。
既有利于被访者获得一定的时间来反思前一次访谈,又不至于造成两次访谈之间时间间隔过久而使得被访者的前后两次访谈的关系变得淡化。
访谈地点:被访者居所或办公室、约定的公共场合(如水吧、茶馆、咖啡厅等)以及研究者居所或办公室。
(尽量尊重被访者意见)(二)访谈的准备工作(三)访谈关系的建立与维持(四)访谈技巧(五)访谈记录关联性检验(measures of association)是统计学最重要的方法之一。
关联性取决于测量的水平与检验的类型。
例如,定类数据测量需要一种关联性测量,而定序数据则需要另外一种,关联性检验的种类包括独立性检验(即检验一个变量是否依赖另一个变量)和相关性检验(即检验一个变量是否随另一个变量的变化而增减)。
T检验——是定序变量的关联性测量方法。
当一个自变量为定类或定序而另一个变量为定距时,用T检验。
卡方检验是一种检验变量变异性的测量。
适用于进行变量间的独立性检验。
如果把一个变量对另一个变量的可能的影响归结为仅仅由偶然因素引起,那么这两个变量可视为独立变量,即一个变量的变化不依赖于另一个变量。
相关性是一种关联性测量,是一种动态测量;描述两个变量联系的紧密程度,当一个变量变化时,另一个变量也随之而变化。
如果变化的轨迹相近,则两者高度相关。
另一方面,独立性是一种静态测量,它是检验交互表中观察值的分布是否超出了可以归结为偶然发生的范围,与变量间的动态关系无关,卡方作独立性检验,T检验适用于两组间比较,多组比较适用于方差分析,ANOV A更强调样本组内与组间的变化而不是样本均值。
ANOV A将发生在因变量上的变化分为由自变量作用的方差(称为被解释方差——主效应)和不被解释的方差(称为误差或剩余方差)。
T检验、ANOV A和相关检验是主要的参数统计假设检验。
任何有两个或者更多个自变量的ANOV A可以是“多因子”ANOV A。
一个自变量单独对因变量的影响不同于第二个或后面自变量的影响,A因子、B因子、C因子对因变量的共同作用成为交互效应。
交互效应可以看成是两个变量共同的贡献,但两变量如果分开,则观察不到这种贡献。
假如因变量的差异对一个变量和另一个变量来说是相同的,那么所分析的交互效应会趋于零。
相关检验—T检验是均值检验,相关则是一种“关联性”检验。
相关测量一个变量值的改变与另一个变量值改变的关联程度。
相关的显著性是指,系统性变化是否由非偶然因素引起;换言之,相关系数是否显著大于零。
最常见的相关检验是皮尔逊积矩相关系数。
当分析这有某一连续变量和另一定序变量时,适合的相关系数是斯皮尔曼级序相关系数。
非参数检验中最常见的是卡方检验。
卡方的一项使用是“拟合优度”检验,测量观察时间相对于期望事件的频数。
如果观察结果与期望的结果相适合,则不拒绝零假设。
内容分析法的步骤:1、选择主题2决定样本或普查3、定义要计算的概念或单位4、建构类别5、制作编码表6、训练编码员7、收集资料8、测量编码员之间的信度9、分析数据10、报告结果.研究过程:选择研究课题@确定课题价值@回溯研究文献@陈述理论假设@数据分析与阐释@呈报结果@何时使用众数、中位数和均值?如果数据属性是分类的,而且数值只属于一种类型,例如头发颜色、政治背景、邻里位置和宗教,就是用众数。
在这种情况下各个分类之间是互斥的。
如果数据中包含极值而且你不想扭曲平均数就是用中位数,例如收入。
最后,如果数据不包括极值也不是分类数据就是用均值,例如考试得分或游50码需要的时间。
在多因素实验研究中,主效应就是在考察一个变量是否会对因变量的变化发生影响的时候,不考虑其他研究变量的变化,或者说将其他变量的变化效应平均掉。
换句话说,就是其他研究变量都不变化的情况下,单独考察一个自变量对因变量的变化效应。
交互效应,则是反映两个或两个以上自变量相互依赖、相互制约,共同对因变量的变化发生影响。
换句话说,如果一个自变量对因变量的影响效应会因另一个自变量的水平不同而有所不同,则我们说这两个变量之间具有交互效应。
在分析多个自变量的效应时,要注意主效应与交互效应之间的关联性。
我在《应用实验心理学》的第二章末尾,专门就这一问题进行了讨论。
现录于此,仅供参考:在析因实验(多因素实验)中,数据收集、数据分析的主要目标是考察自变量的主效应和交互效应是否显著。