心理统计学复习题公司内部编号:(GOOD-TMMT-MMUT-UUPTY-UUYY-DTTI-第一章※1.心理与教育统计的定义与性质。
(名词解释)心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据所传递的信息,进行科学推论找出心理与教育活动规律的一门学科。
2.心理与教育统计学的内容(描述统计、推论统计的界定)。
(名词解释)描述统计:主要研究如何整理心理与教育科学实验或调查得来的大量数据,描述一组数据的全貌,表达一件事物的性质。
推论统计:主要研究如何通过局部数据所提供的信息,推论总体的情形。
※3.心理与教育科学研究数据的特点。
(填空、选择、简答)多用数字形式呈现数据具有随机性和变异性随机因素,随机误差,随机现象数据具有规律性研究目标是通过部分数据推论总体※4.心理与教育统计的数据类型。
(填空、选择)1.按照数据观测方法或来源划分2.按照测量水平3.数据是否连续A.计数数据 A.称名数据 A.离散数据B.测量数据 B.顺序数据 B.连续数据C.等距数据D.比率数据※5.变量、观测值与随机变量。
(名词解释)变量:是指一个可以取不同数值的物体的属性或事件。
由于其数值具有不确定性,所以被称之为变量。
变量的具体取值即观测值。
随机变量:指在取值之前不能预料取到什么值的变量,一般用X,Y表示。
※6.总体、个体与样本。
(名词解释)总体:又称母体、全域,是指具有某种特征的一类事物的全体。
个体:组成总体的每个基本单元。
样本:从总体中抽取的一部分个体,构成总体的一个样本。
※7.参数与统计量。
(名词解释)参数又称为总体参数,是对总体情况进行描述的统计指标。
统计量又称特征值,是根据样本的观测值计算出来的一些量数,它是对样本的数据情况进行描述。
第二章1.对数据资料进行初步整理的基本方式。
(填空、选择)排序和统计分组2.统计分组应该注意的问题。
(简答)要以被研究对象的本质特性为分组基础;分类标志(被研究对象的本质特性)要明确,能包括所有的数据。
“不能既是这个又是那个”3.分组的标志形式。
(填空、选择)性质类别(称名数据与顺序数据)与数量类别。
4.组距与分组区间。
(填空、选择)组距:任意一组的起点与终点的距离。
i= R / K, 常取2、3、5、10、20。
分组区间(组限)即一个组的起点值和终点值。
起点值为组下限,终点值为组上限。
组限有表述组限和精确组限两种。
5. 不同图表形式所各自适用表示的资料类型。
(选择、填空)表/图适用的数据类型简单次数分布表 计数/测量,离散数据/连续数据分组次数分布表 连续性测量数据相对次数分布表 累加次数分布表直方图连续性随机变量 累加次数分布图连续性随机变量条形图 计数资料/离散型数据资料,称名型数据圆形图 间断性资料 线形图 连续性资料 散点图连续性资料第三章1.集中趋势与离中趋势。
(名词解释)集中趋势:数据分布中大量数据向某方向集中的程度,即在某点附近取值的频率较其它点大的趋势。
离中趋势:数据分布中数据彼此分散的程度。
2.对一组数据集中趋势的进行度量的统计量有哪些(填空、选择) 算术平均数、中数、众数、加权平均数、几何平均数和调和平均数等。
3.算数平均数的计算方法(未分组与分组数据两种情况)。
(填空、选择、计算) (一)未分组数据计算平均数的方法 公式 :表示原始分数的总和,N 表示分数的个数。
(二) 用估计平均数计算平均数i X X N=∑数据值过大时,利用估计平均数(an estimated mean )可以简化计算。
具体方法,先设定一个估计平均数,用符号AM 表示,从每一个数据中减去AM ,使数据值变小,最后将其加入总的计算结果之中。
公式:X ˊ=Xi-AM (三)分组数据计算平均数的方法组中值假设散布在各区间内的数据围绕着该区间的组中值Xc 均匀分布。
计算公式Xc 为各区间的组中值,f 为各区间的次数,N 为数据的总次数,(四)分组数据平均数的估计平均数方法AM 为估计平均数,i 为次数分布表的组距, d 可称为组差数4.平均数的特点。
(填空、选择)在一组数据中,每个变量与平均数之差(称为离均差)的总和等于0 。
在一组数据中,每一个数据都加(减)上一个常数C ,则所得的平均数为原来的平均数加常数C 。
在一组数据中,每一个数据都乘(除)以一个常数C ,则所得的平均数为原来的平均数乘(除)以常数C 。
5.平均数的优缺点。
(简答)1)优点 :反应灵敏;计算严密;计算简单;简明易解;适合于进一步用代数方法演算;较少受抽样变动的影响。
2)缺点:易受极端数据的影响 ;若出现模糊不清的数据时,无法计算平均数。
6.计算与应用平均数的原则。
(简答)同质性原则'X XAM N =+∑N fXc X ∑=i Nfd AM X ∑+=平均数与个体数据相结合的原则平均数与标准差、方差相结合的原则7.中数的应用。
(简答)当一组观测结果中出现两个极端数目;次数分布的两端数据或个别数据不清楚需要快速估计一组数据的代表值。
8.众数的计算方法、众数的优缺点及应用。
(简答、计算)(一)计算众数的方法 1、直接观察法a. 原始数据:例:22,26,7,89, 26 ,4,9b. 在次数分布表中,次数最多的那个分组区间的组中值为众数。
2、公式法 用公式计算的众数称为数理众数。
(1) 皮尔逊经验法 (2)金氏插补法 公式:9.平均数、中数与众数的关系。
(选择、填空、简答)正态分布: Mo=Md=M在偏态分布中,M 永远位于尾端,Md 位于中间,两者距离较近 Mo=3Md-2M在正偏态分布中,M> Md> Mo 在负偏态分布中,M< Md< Mo第四章1.对一组数据离中趋势进行度量的差异量数有哪些各自的意义是怎样的(填空、选择)全距、四分位差、百分位差、平均差、标准差和方差等。
2. 平均差、方差及标准差的计算公式(每一个数据都参与运算)。
(填空、选择、计算)平均差计算公式:1Ni i X =-1N i i X X =-∑13d oM M M M -=-a b a bf Mo L if f +=+⨯样本方差的计算公式: 样本标准差的计算公式:3. 方差与标准差的性质与意义。
(选择、填空、简答)方差是对一组数据中各种变异的总和的测量,具有可加性和可分解性特点。
标准差是一组数据方差的平方根,具有一些特性。
标准差的性质:每一个观测数据加上一个相同常数C 之后,计算到的标准差等于原标准差。
若Yi=Xi+C 则有每一个观测数据乘以一个相同常数C 之后,则所得标准差等于原标准差乘以这个常数。
若Yi=Xi ×C 则有每一个观测值都乘以同一个常数C (C ≠0),再加上一个常数d ,所得的标准差等于原标准差乘以这个常数C 。
若Yi=Xi ×C+d ( C ≠0 )则有方差与标准差的意义(1)方差与标准差是表示一组数据离散程度的最好指标。
其值越大,说明次数分布的离散程度越大,该组数据较分散; 其值越小,说明次数分布的数据比较集中,离散程度越小。
(2)优点:反应灵敏;计算公式严密;容易计算;适合代数运算;受抽样变动小;简单明了。
(3)在正态分布中,可确定平均数上下几个标准差内的数据个数。
(1-1/h2)4. 标准差的应用(差异系数,标准分数与异常值的取舍)。
(选择、填空、简答、计算)一、差异系数标准差:绝对差异量数21nii =21()1n i i XX Sn =-=-∑ss XY=XY s s C ⨯=s s X YC ⨯=对同一特质使用同一观测工具进行测量,所测样本水平比较接近时,可直接比较标准差大小差异系数(coefficient of variation ),又称变异系数、相对标准差等,它是一种相对差异量,用CV 来表示。
差异系数应用于①同一团体不同观测值之间离散程度的比较。
②对于水平差异较大,但进行的是同一种观测的各种团体 二、标准分数标准分数(standard score ),又称基分数或Z 分数(Z- score ),是以均值为参照点,以标准差为单位表示一个原始分数在团体中所处位置的相对位置量数。
即原始数据在平均数以上或以下几个标准差的位置。
公式:三、异常值的取舍三个标准差法则当数据较多时,如果数据值落在平均数加减三个标准差之外,则在整理数据时,可将此数据作为异常值舍弃。
当数据较少时,需考虑全距与标准差之比,再加以其他处理。
5. 标准分数的意义及计算公式。
(选择、填空、简答、计算)*见第4题第二点 标准分数的优点可比性可加性明确性稳定性6. 标准分数的性质。
(选择、填空、简答)Z 分数的性质s x s X X Z =-=Z分数无实际单位,是以平均数为参照点,以标准差为单位的一个相对量。
一组原始分数转换得到的Z 分数可以为正值,也可以是负值。
凡小于平均数的原始分数的Z值为负数,大于平均数的原始分数的Z值为正数,等于平均数的原始分数的Z值为零。
所有原始分数的Z分数之和为零,Z分数的平均数也为零。
即∑Z=0,=0一组原始数据转换后Z分数的标准差是1,即Sz=1.若原始分数成正态分布,则转换得到的所有Z分数的均值为0,标准差为1的标准正态分布(standard normaldistribution)7. 标准分数的应用。
(选择、填空、简答)用于比较几个分属性质不同的观测值在各自数据分布中相对位置的高低。
某学生的身高、体重哪个在班级中位置在前面计算不同质的观测值的总和或平均值,表示在团体中的相对位置。
计算各科的总成绩表示标准测验分数Z’=aZ+bIQ=15Z+100T=500+100Z第五章1.事物之间的关系类型。
(填空、选择)因果关系、共变关系和相关关系。
2.相关的类型。
(填空、选择)正相关、负相关和零相关。
3.散点图的不同形式与不同的相关关系的对应。
(填空、选择)4.积差相关的计算的前提条件。
(选择、填空、简答)积差相关的适用条件:成对数据,样本容量要大(>30);两变量来自的总体均为正态分布;两个变量都是连续数据/测量数据;两变量之间为线性关系:可根据相关散布图判断。
5.积差相关的计算公式。
(填空、选择、计算)6. 斯皮尔曼(二列)与肯德尔(多列)等级相关的适用数据类型。
(选择、填空)斯皮尔曼(二列)等级相关适用于两个以等级次序表示的变量,并不要求两个变量总体呈正态分布,也不要求样本的容量必须大于30。
肯德尔和谐系数常以 W 表示,适用于多列等级变量相关程度的分析。
肯德尔和谐系数可以反映多个等级变量变化的一致性。
肯德尔U系数又称一致性系数,适用于对K 个评价者的一致性进行统计分析。
7. 质与量相关的数据类型及具体的相关类别。
(选择、填空)一列为等比或等距的测量数据,另一列按性质划分的类别质量相关包括点二列相关、二列相关和多系列相关。