第一章绪论1.名词解释随机变量:在统计学上,把取值之前不能预料取到什么值的变量称之为随机变量总体:又称为母全体、全域,指据有某种特征的一类事物的全体样本:从总体中抽取的一部分个体,称为总体的一个样本个体:构成总体的每个基本单元称为个体次数:指某一事件在某一类别中出现的数目,又成为频数,用f表示频率:又称相对次数,即某一事件发生的次数被总的事件数目除,亦即某一数据出现的次数被这一组数据总个数去除。
频率通畅用比例或百分数表示概率:又称机率。
或然率,用符号P表示,指某一事件在无限的观测中所能预料的相对出现的次数,也就是某一事物或某种情况在某一总体中出现的比率统计量:样本的特征值叫做统计量,又叫做特征值参数:总体的特性成为参数,又称总体参数,是描述一个总体情况的统计指标观测值:在心理学研究中,一旦确定了某个值,就称这个值为某一变量的观测值,也就是具体数据2.何谓心理与教育统计学学习它有何意义心理与教育统计学是专门研究如何运用统计学原理和方法,搜集。
整理。
分析心理与教育科学研究中获得的随机数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育活动规律的一门学科。
3.选用统计方法有哪几个步骤首先要分析一下试验设计是否合理,即所获得的数据是否适合用统计方法去处理,正确的数量化是应用统计方法的起步,如果对数量化的过程及其意义没有了解,将一些不着边际的数据加以统计处理是毫无意义的其次要分析实验数据的类型,不同数据类型所使用的统计方法有很大差别,了解实验数据的类型和水平,对选用恰当的统计方法至关重要第三要分析数据的分布规律,如总体方差的情况,确定其是否满足所选用的统计方法的前提条件4.什么叫随机变量心理与教育科学实验所获得的数据是否属于随机变量随机变量的定义:①率先无法确定,受随机因素影响,成随机变化,具有偶然性和规律性②有规律变化的变量5.怎样理解总体、样本与个体总体N:据有某种特征的一类事物的全体,又称为母体、样本空间,常用N表示,其构成的基本单元为个体。
特点:①大小随研究问题而变(有、无限)②总体性质由组成的个体性质而定样本n:从总体中抽取的一部分交个体,称为总体的一个样本。
样本数目用n表示,又叫样本容量。
特点:①样本容量越大,对总体的代表性越强②样本不同,统计方法不同总体与样本可以相互转化。
个体:构成总体的每个基本单元称为个体。
有时个体又叫做一个随机事件或样本点6.统计量与参数之间有何区别和关系参数:总体的特性称参数,又称总体参数,是描述一个总体情况的统计指标统计量:样本的特征值叫做统计量,又称特征值二者关系:参数是一个常数,统计量随样本而变化参数常用希腊字母表示,统计量用英文字母表示当试验次数=总体大小时,二者为同一指标当总体无限时,二者不同,但统计量可在某种程度上作为参数的估计值7.试举例说明各种数据类型之间的区别8.下述一些数据,哪些是测量数据哪些是计数数据其数值意味着什么千克厘米秒分是测量数据17人25本是计数数据9.说明下面符号代表的意义μ反映总体集中情况的统计指标,即总体平均数或期望值X反映样本平均数ρ表示某一事物两个特性总体之间关系的统计指标,相关系数r 样本相关系数σ反映总体分散情况的统计指标标准差s样本标准差β表示两个特性中体之间数量关系的回归系数第三章 集中量数1. 应用算术平均数表示集中趋势要注意什么问题应用算术平均数必须遵循以下几个原则:① 同质性原则。
数据是用同一个观测手段采用相同的观测标准,能反映某一问题的同一方面特质的数据。
② 平均数与个体数据相结合的原则 ③ 平均数与标准差、方差相结合原则2. 中数、众数、几何平均数、调和平均数个适用于心理与教育研究中的哪些资料中数适用于:① 当一组观测结果中出现两个极端数目时 ② 次数分布表两端数据或个别数据不清楚时 ③ 要快速估计一组数据代表值时众数适用于:①要快速且粗略的求一组数据代表值时 ②数据不同质时,表示典型情况③次数分布中有两极端的数目时 ④粗略估计次数分布的形态时,用M-Mo 作为表示次数分布是否偏态的指标(正态:M=Md=Mo ; 正偏:M>Md>Mo; 负偏:M<Md<Mo )⑤当次数分布中出现双众数时几何平均数适用于①少数数据偏大或偏小,数据的分布成偏态 ②等距、等比量表实验③平均增长率,按一定比例变化时调和平均数适用于①工作量固定,记录各被试完成相同工作所用时间 ②学习时间一定,记录一定时间内各被试完成的工作量3. 对于下列数据,使用何种集中量数表示集中趋势其代表性更好并计算它们的值。
⑴ 4 5 6 6 7 29 中数=6 ⑵ 3 4 5 5 7 5 众数=5⑶ 2 3 5 6 7 8 9 平均数=4. 求下列四个年级的总平均成绩。
年级一 二 三 四 x91 92 94 n236318215200解:i iTiX 91.72n236318215200===+++∑∑5. 三个不同被试对某词的联想速度如下表,求平均联想速度被试 联想词数 时间(分)词数/分(Xi )A 13 2 13/2B 13 3 13/3 C1325-解:C 被试联想时间25分钟为异常数据,删除H i11M 5.211123()N X 21313===+∑调和平均数6. 下面是某校几年来毕业生的人数,问平均增加率是多少并估计10年后的毕业人数有多少。
年份 1978 1979 1980 1981 1982 1983 1984 1985 毕业人数54260175076081093010501120解:用几何平均数变式计算:Mg= 1.10925== 所以平均增加率为11% 10年后毕业人数为1120×=3159人第四章 差异量数1. 度量离中趋势的差异量数有哪些为什么要度量离中趋势度量离中趋势的差异量数有全距、四分位差、百分位差、平均差、标准差与方差等等。
在心理和教育研究中,要全面描述一组数据的特征,不但要了解数据的典型情况,而且还要了解特殊情况。
这些特殊性常表现为数据的变异性。
如两个样本的平均数相同但是整齐程度不同,如果只比较平均数并不能真实的反映样本全貌。
因此只有集中量数不可能真实的反映出样本的分布情况。
为了全面反映数据的总体情况,除了必须求出集中量数外,这时还需要使用差异量数。
2. 各种差异量数各有什么特点见课本103页“各种差异量数优缺点比较”3. 标准差在心理与教育研究中除度量数据的离散程度外还有哪些用途 可以计算差异系数(应用)和标准分数(应用)4. 应用标准分数求不同质的数据总和时应注意什么问题 要求不同质的数据的次数分布为正态5.计算下列数据的标准差与平均差Xi 11.013.010.09.011.512.213.19.710.5X 11.1N9++++++++===∑Xi-X 10.7A.D.=1.19n9==∑ 6.7. 今有一画线实验,标准线分别为5cm 和10cm ,实验结果5cm 组的误差平均数为,标准差为,10cm 组的误差平均数为,标准差为,请问用什么方法比较其离散程度的大小并具体比较之。
用差异系数来比较离散程度。
CV1=(s1/1X )×100%=×100%=% CV2=(s2/2X )×100%= ×100%=%<CV1 所以标准线为5cm 的离散程度大。
8. 求下表所列各班成绩的总标准差班级 平均数 标准差 人数 di 1 40 2 51 3 48 443iN40514843182=+++=∑ii T iN X 90.54091.05192.04889.54316525.5X 90.80N182182⨯+⨯+⨯+⨯====∑∑T i i d X X =- 其值见上表22222i iN s 40 6.251 6.548 5.843 5.26469.79=⨯+⨯+⨯+⨯=∑22222i iN d 400.351(0.2)48(1.2)43 1.3147.43=⨯+⨯-+⨯-+⨯=∑Ts 6.03=== 即各班成绩的总标准差是第五章 相关关系1. 解释相关系数时应注意什么(1) 相关系数是两列变量之间相关成都的数字表现形式,相关程度指标有统计特征数r 和总体系数ρ (2) 它只是一个比率,不是相关的百分数,更不是等距的度量值,只能说r 大比r 小相关密切,不能说r大=是r 小=的两倍(不能用倍数关系来解释)(3) 当存在强相关时,能用这个相关关系根据一个变量的的值预测另一变量的值 (4) -1≤r ≤1,正负号表示相关方向,值大小表示相关程度;(0为无相关,1为完全正相关,-1为完全负相关)(5) 相关系数大的事物间不一定有因果关系(6) 当两变量间的关系收到其他变量的影响时,两者间的高强度相关很可能是一种假象 (7) 计算相关要成对数据,即每个个体有两个观测值,不能随便2个个体计算(8) 非线性相关的用r 得可能性小,但并不能说不密切2. 假设两变量为线性关系,计算下列各情况的相关时,应用什么方法 (1) 两列变量是等距或等比的数据且均为正态分布(积差相关) (2) 两列变量是等距或等比的数据且不为正态分布(等级相关)(3) 一变量为正态等距变量,另一列变量也为正态变量,但人为分为两类(二列相关) (4) 一变量为正态等距变量,另一列变量也为正态变量,但人为分为多类(多列相关) (5) 一变量为正态等距变量,另一列变量为二分称名变量(点二列相关) (6) 两变量均以等级表示(等级相关、交错系数、相容系数) 3. 如何区分点二列相关与二列相关主要区别在于二分变量是否为正态。
二列相关要求两列数据均为正态,其中一列被人为地分为两类;点二列相关一列数据为等距或等比测量数据,且其总体分布为正态,另一列变量是二分称名变量,且两列数存在一一对应关系。
4. 品质相关有哪几种各种品质相关的应用条件是什么品质相关分析的总条件是两因素多项分类之间的关联程度,分为一下几类:(1) 四分相关,应用条件是:两因素都为正态连续变量(eg.学习能力,身体状态))人为分为两个类别;同一被试样品中,分别调查两个不同因素两项分类情况(2) Φ系数:除四分相关外的2×2表(最常用) (3) 列联表相关C :R ×C 表的计数资料分析相关程度5. 预考查甲乙丙丁四人对十件工艺美术品的等级评定是否具有一致性,用哪种相关方法等级相关6. 下表是平时两次考试成绩分数,假设其分布成正态,分别用积差相关与等级相关方法计算相关系数,并回答,就这份资料用哪种相关法更恰当被试 A B A 2 B 2 AB R A R B R A R B D=R A -R B D 2 1 86 83 7396 6889 7138 2 3 6 -1 1 2 58 52 3364 2704 3016 7 8 56 -1 1 3 79 89 6241 7921 7031 4 1 4 3 9 4 64 78 4096 6084 4992 6 4 24 2 4 5 91 85 8281 7225 7735 1 2 2 -1 1 6 48 68 2304 4624 3264 9 6 54 3 9 7 55 47 3025 2209 2585 8 9 72 -1 1 8 82 76 6724 5776 6232 3 5 15 -2 4 9 32 25 1024 625 800 10 10 100 0 0 10 75 56 5625 3136 4200 5 7 35 -2 4 ∑670659480804719346993555536834N XY X Y0.82-==2R 226D 634r 110.794N(N -1)10(101)⨯=-=-=⨯-∑或 X Y R 4R R 334368r [(N+1)]110.794N-1N(N+1)9110⨯⎛⎫=-=⨯-= ⎪⎝⎭∑用积差相关的条件成立,故用积差相关更精确7. 下列两列变量为非正态,选用恰当的方法计算相关 本题应用等级相关法计算,且含有相同等级X 有3个数据的等级相同,等级的数据中有2个数据的等级相同,等级为和的数据中也分别有2个数据相同;Y 有3个数据等级相同,等级为3的数据中有3个数据等级相同,等级为的数据中有2个数据等级相同,等级为9的数据中有3个数据等级相同。