第六讲推断统计参数估计
Esn 21 nnD D XX nn 1DX
s s E n
n1
n 2nn1E
2DX
n
s s 记:
2n 2 n1 n1 n
s xX 则有: 2 1 n n1 n1i1
i
2
s 由上:E2 D X2 n 1
■结论:s
2 n
1才是总体方差
2 的无偏估计
⑵有效性
指当总体参数的无偏估计不止一个时,统计
⑵置信区间、与显著性水平 ①显著性水平(significance level) 指断定总体参数落在某一区间时,可能犯
错误的概率,常以符号 表示。
■置信度
1表示置信度或置信水平。
②置信区间(confidence interval) 也称置信距,是指在某一置信度时,总体参
数所在的区间(区域)。 ■概念的解读
n 1 1
2
n n F 2
1 ~ F 1, 1
1
2
sn 1 2
2 2
②示意图
③区间估计过程
s2
n 1 1
2
n n F 2
1 ~ F 1, 1
1
2
sn 1 2
2 2
s2
n1 1
F n n P
1
2
1, 1F
1
2
2
s Fn n 1
2 n1
2
2
1, 11
1
2
2 2
2
2
2
Fnns s Fnns s P
XZ2
n,XZ2
n
■练习:请写出α=.05及.01时的置信区间
示意图
[例]已知某校在某次考试中,全体考生成绩总体方 差为100,从中抽取5位考生的成绩为65、83、 94、70、88,试求全体考生成绩均值的置信 系数为95%和99%的置信区间。(假设考生的 总体成绩呈正态分布)
②总体 X~N, 2
对总体均值 进行区间估计方法如前,
置信区间为: Xt s t s
(n1)
2
n1,X n
(n1)
2
n1 n
[研究案例]-劳教戒毒者自我价值感特点的初步研究 ———杨波 心理科学2004,27(4)
1、研究目的 探讨劳教戒毒者自我价值感特点
2、研究方法 ⑴研究被试 ①真正被试:北京市160名劳教人员(151名 海洛因成瘾者,9名其他药物成瘾者) 男性110名,女性50名
毒
组 S 4.6 3.4 3.5 3.1 2.6 3.1 2.8 2.5 2.7 3.0 2.8 2.6 2.4 对 M 24.8 21.1 18.5 14.2 15.3 12.6 13.4 16.5 15.2 14.3 12.9 15.7 12.6
照
组 S 5.1 3.6 3.0 3.3 2.7 3.3 2.6 3.0 2.9 3.8 2.1 3.1 6 t统计 6.58** 7.95** 1.13 5.51** 1.04 0.73 -4.44** 19.92** 1.66* -3.27** -2.6** 8.5** -5.83 注:T总体自我价值感、GS社会取向一般自我价值感、GI个人取向一般自我价值感
s
2 n
1是
2 的无偏估计
证:设总体X的方差为 2,在总体X中抽取样
本 x1,x2,...x,n ,则有
s xX 21n n n i1
i
2
2 D X E X E X 2 E x i E x i 2
s x X E2E [1n
n
ni 1
i
2
]
E { 1 n i n 1[x ( i E X ) (X E X )2 } ]
试分别求出身高与体重的总体均值与方差的点 估计。
四、区间估计(interval estimation)相关术语 ⑴区间估计内涵 就是根据样本统计量以一定可靠程度推断 总体参数所在的区间范围,它以区间界定总 体参数可能出现的范围,它不具体指出总体 参数等于多少,但能指出总体参数落入该区 间的概率有多大。 ■与点估计有明显的差异
试 确 定语文成绩的标准差的范围(置信度为 1-0.01)。
⑶两总体方差之比的区间估计
①两总体方差之比的区间估计原理
从二正态总体 N , 2 、N , 2 中,分别随
11
22
机抽取容量为 n 1 、n 2 两样本,设其样本方差分
s s 别为
2
n 1 1
、
2
n
1
2
,则据抽样分布理论有:
s2
■被试结构 文化:小学14人、初中87人、高中50人 大专以上9人 婚姻:未婚57人、已婚82人、离婚21人 职业:有固定职业89人、无固定职业71人
②对照组-根据被试年龄、性别、职业和文化程度 选择对照组185个成人,男95、女90个
⑵测验工具-黄希庭等编制的自我价值感量表 自我价值感量表包括三个层次: ◆总体自我价值感(tse)(最高层次) ◆一般自我价值感(gse)(中间层次) 包括社会取向、个人取向二种 ◆特殊自我价值感(sse)(最低层次)
n 1
n 1 2 2n
⑵方差区间估计 ①方差区间估计原理
设总体 X~N, 2 ,在总体中抽取容量为n的
样本 x1,x2,...x,n,则有:
n1 2
s ~ n1 2
2 (n1)
②方差区间估计过程 (示意图)
n1 2
s ~ n1 2
2 (n1)
s P 21n1n122 n1 2n11
2
1 1 ,
12 n 1 11 2
1
2
n 1 2
2
1 2
1 1 1 , 2 1n 2 n 1 2 1 1 1
2
2
2
Fnns s Fnns s P
2
1
n 1 11
1 , 1 2
2
1
2
n 1 2
2
2
1 1 , 2 1n 2 n 1 2 1 1 1
结论:在置信度为1-α时,置信区间为:
x1,x2,...x,n,其平均数为 X ,则有上述结论。
证:由已知条件,则有:
EX
x X 1 n
n i 1
i
x x EXE 1n 1E n ni 1 i n i 1 i 1 nE x1E x2.. .E xn 1.nEXEX n
■注:ExiEX
s ② 2 是
2有偏估计,而
X
~
N
,
n
ii、区间估计过程(示意图)
2
X ~ N ,
n
Z
X
~
N0,1
n
设定显著性水平为α (置信度1-α ),则有:
PZ2 ZX n Z21
P XZ 2nXZ 2n 1
iii、结论(示意图)
在置信水平为1-α时,总体均值 的置
信区间为
XZ2
n,XZ2
n
。或在显著性水
平为α,总体均值 的置信区间为:
i、样本容量n<30时,无法进行总体均值
的区间估计;
ii、样本容量n>30时,总体均值 的区间
估计与前一样。
⑵总体方差 2 未知,总体 的区间估计
①若总体 X~N, 2
ⅰ、区间估计原理
设在总体X中抽取样本 x1,x2,...x,n,其中
样本平均数为 X , 由抽样分布理论有:
t X ~
是用样本统计量来估计总体参数。
例: X
r
S
■点估计优点
能给出总体参数的估计值
2、良好点估计的标准 ⑴ 无偏性(unbiased estimate) 即用样本统计量估计总体参数时,样本 统计量抽样分布的中心等于总体参数。 ■具体说明
① X 是 的无偏估计
设有一总体为X(或随机变量X),其均值
为 ,从其中随机抽取一个容量为n的样本
接近它所估计的总体参数。 ■例
◆样本容量n→∞时,X
◆样本容量n→∞时,s2n1 2
⑷充分性 指一个容量为n的样本统计量,是否反映了全
部n个数据的信息。 ■例
估计总体X的平均数 ,可以用 X 、Md、Mo
■例 从某地区16岁的男中学生中随机抽取10人,测
得其身高和体重数据如下:
(160.5,43.75)、 (157.40,40.25)、(153.0,42.50) (158.0,49.75)、 (157.5,45.50)、(154.0,42.75) (154.0,41.00)、 (163.0,46.75)、(156.5,45.50) (157.0,45.00)
第六讲 参数估计
一、推断统计的主要内容 ◆参数估计 ◆假设检验
■推断统计的基础是抽样分布理论 二、参数估计
1、参数估计的内涵 在研究中,根据样本数据的信息来对总体
的分布特征行估计,该过程即参数估计。
2、两种类型参数估计 ⑴ 点估计 ⑵ 区间估计
三、点估计
1、点估计内涵(Point estimation)
量变异(方差)越小,则越有效。
■例:估计总体 X的平均数 ,常用样本平
均数 X
Xx1x2xn n
2
2
X
X
n
结论:当然,n越大对应的平均数越有效
■例:估计总体 X的平均数 ,也可以用Mo、
Md,它们也无偏估计量,但在样本容量相
等的情况下,有
2 X
2 Mo
2 X
2 Md
⑶一致性 指的是样本容量n→∞时,样本估计值越来越
(n1)
2
n1,X n
(n1)
2
n1 n
■课堂练习:请写出α=.05及.01时的置信区间
■假设在上例中,总体方差未知,其他情况不变, 试求全体考生成绩均值的置信系数为95%和99% 的置信区间。