心理统计1.描述统计:①是把实验中所得到的数据概括的整理,从中得出实验者可利用的信息。
②常用表和图将实验数据形象地表示出来。
③描述统计的指标有三类:集中量数(一组数据具有代表性的指标,如:平均数、中数、众数等),差异量数(一组数据分散程度的指标,如四分差、标准差、方差),数据间的相关(成对的两组数据之间的关系的指标)。
2.推论统计:①就是从样本的数量特性去推论总体数量。
它包括一系列的统计程序,如:推论假设,推论的方法和步骤,检验推论可靠性的各种方法等。
②将研究对象的全部称为总体③从总体中抽出的参与实验的部分称为样本在心理实验中,主要有三种变量:自变量、因变量、控制变量常用的数据分为两类:计数数据、测量数据计数数据:①是准确数,它是一个一个数出来的。
②计数数据表示在数轴上只占点,如:1,2,3,….数据形式为计数数据的变量称为离散型变量。
测量数据:①是近似数。
测量数据是通过测量工具得到的。
②数据形式为测量数据的变量,称为连续性变量。
用表整理实验数据常用的表格有三种:原始数据表(原始记录表)、次数分布表、实验结果表3.组距:①每一组上限和下限的差。
②上限就是小组的最高数值加上半个单位;②下限就是小组的最低数值减去半个单位(组距习惯上常用2,3,5,10或10的倍数)常用的图直方图上下限标点必须从0开始曲线图(折线图)多边图:横轴用各组中点,纵轴以各组数据个数或百分数标点,形成封闭图形累积曲线图:横轴以组上限为标点,纵轴以次数和百分数,形成越来越高的曲线当横坐标代表的数据是计数数据时只能画直条图和直方图。
当横坐标代表的数据是测量数据时,可以画直方图和曲线图。
4.正态分布又称正态曲线或钟形分布。
①它是连续性随机变量的概率分布形态。
②是一个单峰曲线,中间高,两边逐渐下降,在正负一个标准差的地方有拐点,两端永远不与横轴相交,两侧完全对称的钟形曲线Y=1/√2∏*e -x2/25.分峰分布:在作完图形之后,有时会发现作出的曲线出现了高低差不多的两个峰。
这时就好生生了双峰现象。
产生原因:①分组时组距不当②数据中混有性质不同的两种数据当多数数据集中在曲线的一端,而少数数据在曲线的另一端,数据分布的形态就产生了偏斜。
当偏斜的一边趋向正数的方向时,叫正偏态。
当偏斜的一边趋向负数作出的方向时,称为负偏态。
6. 中点:X’。
假设数据均匀地分布在组距之间,这一组数值的代表点叫中点。
它是在某一组的下限和上限中间的那一点数值。
中点=组上限+组下限/2集中量数:①表示数据集中趋势的指标叫做集中量数,②它是一组数据的代表值,比起个别数据来,更能准确地反映所研究的事物和现象的真实情况,是真值最好的估计值。
③常用的集中量数有三种:平均数、中数、众数。
平均数:①是指算术平均数,符号X ,集中趋势的重要指标,表示一组数据的平均值。
②当数据比较集中,分布比较均匀,没有极端数值,我们就用平均数来代表这组数据的集中趋势。
③平均数是集中趋势中代表性最大,最稳定的数据指标。
平均数公式:NX X ∑=X =∑FX ’/N极端数值:在一组数据中存在特别大或特别小数值。
当数据中出现极端数值,就不适宜用平均数来表示集中趋势,而应该改用中数。
加权平均数:已知几组数据各自的平均数,又知道这几组的数据个数不相等时,需要计算总平均数,就一定要用加权平均数的方法计算总平均数。
10-1加权平均数---简单应用概念:加权平均数符号W X 。
已知几组数据各自的平均数,又知道这几组的数据个数不相等时, 需要计算总平均数,就一定要用加权平均数方法计算总平均数。
公式:nX n X W ∑∑=)( X W :加权平均数 使用加权平均数的条件:已知各组平均数,各组人数不相等 求加权平均数的注意事项:一定要写单位 加权百分数公式:nn X PW ∑∑=)p (9. 中数:符号Mdn ,①是一组按大小排列的数据中位置居中的那个数,它将数据分为大的一半和小的一半。
②当数据存在有极端数值时,我们就用中数来表示数据的集中趋势。
③中数使用的条件:当一组数据有极端数值时,用中数表示极端数值 计算步骤:排序、找位置(位置=(n+1)/2)、求值。
计算步骤:排序、找位置(位置=(n+1)/2)、求值。
利用下限计算: Mdn=L+(N/2-F b /f mdn )I L:为中数所在组的下限;F b :为中数所在组以下各组数据个数之和; f mdn:中数所在组的数据个数利用上限计算:Mdn=U-(N/2-F a /f mdn )I u:数所在组的上限;f a :中数所在组以上各组数据个数之和 i:组距10. 众数:符号Mo 。
众数就是在数据中出现次数最多的那个数。
使用它可以最快地了解数据的集中趋势,但它是一个较粗糙和极不稳定的指标,在正式研究结果中很少采用。
需要很快地知道集中趋势时,需要使用众数。
11. 全距:①是一组数据中最大的数值的上限与最小数值的下限的差。
②它是最简单的差异量数。
③全距大,差异大;全距小,差异小,数据较集中。
使用时注意:1、无极端值;2、比较两个分布的全距时,当两个分布所包含数据的数目相等或差不多时才能使用12. 离中趋势:①是表示一组数据的值是差不多一般大小,还是大的大、小的小差异悬殊。
数据之间的这种差异称为离中趋势,②表示离中趋势的指标叫差异量数,③常用的指标有:全距,四分差,平均差和标准差、离中系数等。
13. 四分差(Q ):①是数据的离中趋势的指标之一。
②四分差表示按大小顺序排列的一组数据中间50%个数据的分散程度的指标 ③Q=Q 3-Q 1/2 Q 1:25%百分点 Q 3;75%百分点Q 2位置(N+1)/2 Q 1位置(N+1)/4 Q 3位置(N+1)3/410-2四分差计算—简单应用(录音第9课)定义:四分差:符号Q;表示按大小顺序排列的一组数据中间50%个数据的离散程度的指标。
使用条件:当一组数据中存在极端数值,集中量数就用中数,离中量数就须用四分差。
计算步骤:(1)排序(2)找位置(Q1、Q2、Q3):Q2=(n+1)/2;Q1=(n+1)/4;Q3=(n+1)3/4;(3)求Q1、Q2、Q3的值。
(4)用213QQ Q -=求Q。
判断原理:成绩好坏反应快慢等用集中量数指标;比较分散程度或平均数代表性用离中量数。
依据:Q大,数据分散,平均数代表性小;Q小,数据集中,平均数代表性大;见:课本4-3(见P41)例1:两组被试做同一次心理测验,各人得分如下表:(1)分别计算甲乙两组Q1、Q2、Q3(2)比较两组被试测试成绩。
(3)比较两组被试成绩分散程度,哪一组平均数代表性大。
先做甲组:甲组的顺序:3、4、5、6、7、7、8、16因为有极端数值16,所以计算中数,离中量数用四分差。
做题时直接标上箭头(不用写找位置的公式)求值:Q1=4.25;Q2=6.5;Q3=7.75;利用公式求Q:213QQ Q -==225 .475.7-=1.75计算乙组:乙组的顺序:5、6、6、8、9、10、10、12 求值:Q1=6.25;Q2=8.5;Q3=10.75;利用公式求Q:213QQ Q -==225 .675.10-=2.25解(1):甲组Q1=4.25;Q2=6.5;Q3=7.75;乙组:Q1=6.25;Q2=8.5;Q3=10.75;解(2):因为有极端数值,比较两组被试测验成绩,我们选用集中量数指标中数来比较。
因为甲的中数为6.5,乙的中数为8.5,因为甲组小于乙组,所以乙组成绩较好。
(不知道为什么录音上乙组中数算得是7,有可能是乙组数据我听错一位,不过知道怎么解题就成了)解(3):因为有极端数值,集中量数用中数,离中量数须用四分差来比较分散程度。
Q大,数据分散,平均数代表性小;Q小,数据集中,平均数代表性大。
因为Q甲=1.75,Q乙=2.25,所以乙组成绩分散,甲组平均数代表性大。
例2:两组被试解决问题所用时间如下表(单位:分钟):(1)甲乙两组中数和Q。
(2)哪一组解决问题快。
(3)哪一组分散。
选用比较指标。
求甲组,首先排序:1、2、3、4、5、45记得标上箭头中数(Mdn)=Q2=3.5Q1=1.75;Q3=15利用公式求Q:213QQ Q -==275 .115-=6.625 求乙组:首先排序:1、3、5、7、9、11中数(Mdn)=Q2=6Q1=2.5;Q3=9.5;利用公式求Q:213QQ Q -==25.25.9-=3.5解(1)甲组中数为3.5,Q=6.625;乙组中数为4,Q=3.5解(2)因为有极端数值,所以选用集中量数指标中数来比较。
甲组中数为3.5小于乙组中数6,所用时间较少,所以甲组解决问题快。
14. 百分点:某个百分等级上的具体数值。
P P =L P +i(PN/100-F bpd )/F PP P 百分点;L P 该百分点所在组的下限;P 百分位;F BP 百分点所在组下限以下数据个数之和;F P 百分点所在组数据个数15. 百分等级:又叫百分位,是将数据从小到大排列,每个数据所在的位置(累加到的序号)与全部数据个数的百分比。
R X =100﹝F X (X-L X )+F bx*i ﹞/n*I R X 某数值的百分位;F X 所求百分位的数值所在组的数据个数;X 所求百分位的数值L X 某百分点所在组的下限F BX 某百分点所在组的下限以下数据个数之和16. AD :平均差,它是离中量数指标,nXX AD -∑=,这个公式表示每个数与平均数的差的绝对值和的平均值。
17方差:符号S 2,又称变异数,它是离中量数常用指标,nX X S 22)(-∑=,它是以数据中每一数值与均值的差的平方和的均值作为离散程度的指标。
标准差:符号是S ,是离中量数常用指标,NX X S 2)(-∑=,表示每个数与平均数的差的平方和的均值的正方根。
18. 离中系数(cv ):就是表示数据分散程度的相对量。
当两组数据的单位不同、平均数相差过大时,应用离中系数比较。
CV=S/X *10019. z 分数(标准分数):是以标准差为单位所表示的原始分数(x )与平均数的偏离,也可以说是一个以标准差为单位来表示的偏离分数。
Z=(X-X )/S S 标准差z 分数的性质:0=z (z 分数的平均数等于0),12z =S 或S =1(z 分数的方差和标准差等于1)20.T 分数就是以平均数为50,标准差为10进行转换后的分数:公式:T =50+10(z )例:某班100人,语文考试成绩X =60分,S =8分。
(1)求55分和75分的标准成绩.(2)假设服从正态分布,高于76分的人占全部人数的百分之几? (3)低于52分的人,占全部人数的百分之几?解(1):利用公式S XX z -=求标准成绩。
S XX z -= 55=86055-=-0.625 SXXz-=75=86075-=1.875解(2):S XX z -= 76=86076-=2查正态分布表z=2较小部分的面积是0.0228,所以高于76分的人占全部人数的2.28%解(3)S XX z -= 52=86052-=-1查正态分布表z=|-1|较小部分的面积是0.1587,所以低于52分的人占全部人数的15.87%Z分数在统计检验中的重要临界值,即两事物差别显著不显著的分界线。