当前位置:文档之家› 第六章教育统计学

第六章教育统计学

自由度:是指总体参数估计量中变量值能独立自由变化的个数。
【例如】:
第二节 总体平均数的估计
推断统计有两种形式:参数估计和假设检验。
一、总体平均数估计的基本原理
1.点估计
点估计:用一个样本统计量的值估计出一个具体的总体参数值,就称作点估计。如把样本平均数当作总体平均数。
点估计的评价标准:
(1)无偏性:一切可能样本统计量与总体参数的离差和为零。
三、显著性水平
统计学中把拒绝零假设的概率称为显著性水平,用 表示。常用α=0.05和α=0.01两个水平。显著性水平与 值成反序关系。
单侧与双侧(参看教材96页)。
四、统计决断的两类错误
1、I型错误:零假设为真而被拒绝。这类错误也称 错误。
2、Ⅱ型错误:零假设为假而被保留,即备择假设为真而被拒绝(参看教材117页图6.3b)。这类错误也称β错误。
当 已知时,用Z估计;当 未知时,其原理与 已知时基本相同,只是临界值不固定。95%置信度的临界值可写作:t(df)0.05/2;99%置信度的临界值可写作:t(df)0.01/2。
为标准误,有不同的计算公式。
公式的三种不同形式
2.小样条件下的估计
【例】:某研究人员对红星小学五年级学生进行智力测查,从测查结果中随机抽出16个学生的智力分数,求得平均智力为106分,标准差为5分,试计算该校五年级学生智力分数的99%的置信区间.
于是检验统计量为: 。
用原始数据计算:
(3)确定检验形式
没有资料可以说明该校初三英语成绩是高于还是低于全区的平均水平,故采用双侧检验。
(4)统计决断
df=n-1=20-1=19
查表知t(19)0.05=2.093,t(19)0.01=2.861
∵t=2.266 > 2.093
∴P< 0.05
因此,在0.05水平上拒绝零假设,接受备择假设。该校初三英语平均分数与全区平均分数有本质区别。或者说,它不属于平均数为65的总体。
一、假设
假设有两种:研究假设和统计假设
统计假设:是指对样本所属总体的参数水平或分布形态的推测。
假设检验中一般有两个相互对立的假设:零假设(虚无、消解假设)和备择假设(期望假设),分别用H0和H1表示。
零假设的实质:无差异。
备择假设的实质:有差异。
假设检验是从零假设出发的。
二、小概率事件
样本统计量的值在其抽样分布上出现的概率小于或等于事先规定的水平,则该事件就为小概率事件。小概率事件是否发生,是对零假设做出取舍的依据。
3、减少两类错误的方法
减小α值,会增大β值。
(1)α错误由研究者对差异标准的要求决定。
(2)在α值不变的情况下,减小β错误的方法有两种:一是合理安排拒绝区域;二是增大样本容量。用图示说明。
第四节 总体平均数的显著性检验
根据一个样本信息推断样本所属总体与已知总体是否有差异的检验就称为平均数的显著性检验。检验的基本过程:
注:点估计既不能指明估计误差大小,也不能说明正确估计的概率大小。
2、区间估计
(1)区间估计:是指以统计量的抽样分布为理论依据,按一定概率要求,由样本统计量的值估计出总体参数值的所在范围。
(2)平均数区间的估计原理:
当总体 已知时,根据平均数抽样分布定理,在95%的置信度上估计:
将括号内的不等式整理可得:

第三节 假设检验的基本原理
以平均数为例,看假设检验的基本原理。从已知总体抽出的容量为n的一切可能样本的平均数形成的分布如右图,现有一个随机样本, 其平均数为 ,这个样本是来自 这一已知总体吗?原理,视其在以 为中心的平均数抽样分布上出现的概率大小而定。若样本平均数在抽样分布中出现的概率较大,则认为样本所属总体和已知总体为同一总体;若样本在抽样分布中出现的概率较小,则认为样本所属总体与已知总体有显著性差异。
(3)确定检验形式
没有资料可以说明文科学生数学成绩低于还是高于全市平均水平,故采用双侧检验。
(4)统计决断
∵Z0.05=1.96 < 2.11 < 2.58=Z0.01
∴0.01<P<0.05,于是在0.05显著性水平上拒绝H0,而接受H1。
所以,某市文科学生数学高考平均分数与全市平均分数有本质区别,或者说,它不属于平均数为60的总体。
99%的置信区间为:
我们有99%的把握说该校五年学生的平均智力在102.18至109.82之间.
3.大样本条件下的估计
总体为正态, 未知,但n较大,t分布接近z分布,在这种条件下,既可按t分布估计,也可按z分布估计。t估计准确性高,而z估计简便。
【例】:从某大学的四级英语试卷中随机抽出200份,算出 。求该校四级英语平均成绩的95%的置信区间。
【例2】::某市数学竞赛的平均成绩为63.5分,A校10名参赛者的平均成绩为66分。标准差8分,问A校的成绩是否显著高于全市的成绩?
检验:
总体为正态分布,σ未知,且n=10<30,所以采用t检验.
(3)确定检验形式
※:根据提问方式或假设,在0.05水平上保留零假设,拒绝备择假设。结论为A校的成绩与全市的成绩无显著差异。
假定总体为正态分布,总体σ已知,所以采用z检验
(3)确定检验形式
没有资料说明实验班的成绩过去是高于还是低于全年级的成绩,所以采用双侧检验。
(4)统计决断
因此,在0.05水平上保留零假设,拒绝备择假设,结论为实验班的成绩与全年级的成绩差异不显著。
※:注意推断规则(参看教材99页)
【例】:某区高中物理会考平均分为81分,标准差为8分,区重点中学150名学生的平均分为82.8分。过去资料表明区重点中学的成绩高于全区的水平,问此次会考区重点中学的成绩是否仍然显著高于全区的平均成绩?
1.小样本的情况
【例1】:(教材101页)某区初三英语统一测验平均分为65,该区某校20份试卷的分数为:72、76、68、78、62、59、64、85、70、75、61、74、87、83、54、76、56、66、68、62。问该校初三英语平均分数与全区是否一样?
检验:
学生英语测验分数可以假定是从正态总体抽出的随机样本,而总体标准差σ未知。样本容量较小,n=20<30,在此条件下,样本平均数与总体平均数的离差统计量呈t分布。
2.大样本的情况
当n>30时t分布近似Z分布,且 与 差异不大,故可近似采用z检验。
【例】:某年高考某市数学平均分为60,现从参加此次考试的文科学生中,随机抽取94份试卷,算得平均分数为58分,标准差为9.2,问文科数学成绩与全市考生数学成绩是否相同?
检验:
文科学生数学高考分数假定是从正态总体抽出的随机样本,而总体标准差σ未知。样本平均数与总体平均数离差统计量呈t分布,但因样本容量较大,n=94 > 30,t分布接近于正态,故可用正态分布近似处理。
【如】:
:为无偏估计量, :为有偏估计量。所以
(2)有效性:当总体参数不止有一种无偏估计量时,某一统计量的一切可能样本值的方差小者为有效性高,方差大者为有效性低。
【如】: 的有效性高,M0、Md的有效性低。
(3)一致性:当n无限增大时,估计量的值越来越接近它所估计的总体参数值,则这种估计量是总体参数的一致性估计量。
为置信上限。
【例】:某区高一学生的英语统考成绩的标准差为6分,从此次考试的试卷中随机抽出100份试卷,算得平均分为71分。试求全区平均成绩的95%和99%的置信区间:
解:∵
1.95%的置信区间为:
2.99%的置信区间为:
※:置信度越高,置信区间就越大。
三、 未知条件下总体平均数的区间估计
1.基本原理
1.提出假设;
三种常见的假设形式:
(1)
(2)
(3)
2.选择检验统计量并计算其值;
3.确定检验形式;
4.统计决断。
一、 已知条件下总体平均数的显著性检验
【例】:某校初一年级英语测验的平均成绩为78分,标准差为7分。实验班40名学生的平均成绩为79.5分,问实验班成绩与全年级的成绩有无显著性差异?
检验:
检验:
假定总体为正态分布,且 已知,所以采用Z检验
(3)确定检验形式
过去资料说明区重点中学的成绩高于全区的平均成绩,所以采用右侧检验。
(4)统计决断
因此,在0.01水平上拒绝零假设,接受备择假设。结论为重点中学的物理会考成绩,仍然显著高于全区的平均成绩。
※:注意单侧检验与双侧检验的区别。
二、σ未知条件下总体平均数的显著性检验
3.抽样分布:某种统计量的概率分布。平均数的抽样分布:从某一总体中抽出的,容量为n的一切可能样本平均数的分布。
【如】:样本平均数的抽样分布、相关系数的抽样分布。
二、平均数抽样分布的几个定理
1.从总体中随机抽出容量为n的一切可能样本平均数之平均数等于总体平均数。
E表示平均的符号.
2.容量为n的样本平均数在其抽样分布上的标准差,与总体标准差成正比,与样本容量n的方根成反比。
2.总体为正态分布,但总体 未知,平均数的离差统计量呈t分布。
(1)总体标准差的估计量:
(2)平均数的标准误的估计量:
(3)平均数的离差统计量:
注:
(4)t分布的特点
① 单峰对称,曲线与基线永不相交;
②t值有正有负,也可为零;
③t分布是随df=n-1而变化的一簇分布;
参看教材86页。
图例6.1和表6.1
:是平均数抽样分布上的标准差(一般称作平均数的标准误)。
3.从正态总体中,随机抽取的容量为n的一切可能样本平均数的分布也呈正态分布。
4.虽然总体不是正态分布,如果样本容量n很大,平均数的抽样分布也近似正态分布。
※:标准误越小,表明统计量与参数值越接近。
三、样本平均数与总体平均数离差统计量的形态
1.总体为正态分布,总体标准差 已知时,平均数的离差统计量呈标准正态分布。可写作
相关主题