当前位置:
文档之家› 医学统计学 03_2 参数估计
医学统计学 03_2 参数估计
6
0.718 0.906 1.440 1.943 2.447 3.143 3.707 4.317 5.208 5.959
7
0.711 0.896 1.415 1.895 2.365 2.998 3.499 4.029 4.785 5.408
8
0.706 0.889 1.397 1.860 2.306 2.896 3.355 3.833 4.501 5.041
附表2 t 界值表
0.10 0.20 3.078 1.886 1.638 1.533 1.476
概 率,P 0.05 0.025 0.01 0.10 0.05 0.02 6.314 12.706 31.821 2.920 4.303 6.965 2.353 3.182 4.541 2.132 2.776 3.747 2.015 2.571 3.365
主要内容
点估计 区间估计 两个要素 均数可信区间的构建 正确理解可信区间的涵义
2015/3/6
2
统计推断的内容
参数估计
(parameter estimation)
假设检验
(hypothesis test)
2015/3/6
3
参数估计
• 由样本统计量估计总体参数
– 点估计(point estimation) – 区间估计(interval estimation)
概 率,P 0.05 0.025 0.01 0.10 0.05 0.02 6.314 12.706 31.821 2.920 4.303 6.965 2.353 3.182 4.541 2.132 2.776 3.747 2.015 25 0.0025 0.001 0.0005 0.01 0.005 0.002 0.001 63.657 127.321 318.309 636.619 9.925 14.089 22.327 31.599 5.841 7.453 10.215 12.924 4.604 5.598 7.173 8.610 4.032 4.773 5.893 6.869
25 70.9(次 / 分)
X
t0.05,24
s X
73.6 2.064 6.5 /
25 76.3(次 / 分)
即该地正常成年男子脉搏总体均数的95%可信区间为:
70.9~76.3(次/分) 。用该区间估计该地正常成年男子脉搏总
体均数的可信度为95%。
2015/3/6
16
例4.2
某 市 2001 年 120 名 7 岁 男 孩 身 高 均 数 为 123.62cm,标准差为4.75cm,计算该市7岁 男童总体均数90%的可信区间。
(n1
1)s12 (n2 1)s22 n1 n2 2
• 均数之差的标准误
s X1 X2
sC2
(
1 n1
1 n2
)
2015/3/6
22
计算
sC2
11 9.772 12 12.172 12 13 2
122.93
s X1 X2
122.93 ( 1 1 ) 4.439 12 13
9
0.703 0.883 1.383 1.833 2.262 2.821 3.250 3.690 4.297 4.781
10
0.700 0.879 1.372 1.812 2.228 2.764 3.169 3.581 4.144 4.587
21 22 23 24 25
2015/3/6
0.686
0.686 0.685 0.685 0.684
3.135
3.119 3.104 3.091 3.078
3.527
3.505 3.485 3.467 3.450
3.819
3.792 3.768 3.745 3.725
15
例4.1
本例自由度=12-1=24,经查表得t0.05,24=2.064,则
X
t0.05,24
s X
73.6 2.064 6.5 /
-t
0
t
0.005 0.0025 0.001 0.0005 0.01 0.005 0.002 0.001 63.657 127.321 318.309 636.619 9.925 14.089 22.327 31.599 5.841 7.453 10.215 12.924 4.604 5.598 7.173 8.610 4.032 4.773 5.893 6.869
X =144.07
s = 4.72 x1,x2,x3…x10
2015/3/6
6
点估计
• 直接用样本统计量作为总体参数的估计值
–方法简单,但未考虑抽样误差的大小 –在实际问题中,总体参数往往是未知的,但它们是固
定的值,并不是随机变量值。而样本统计量随样本的 不同而不同,属随机的。
2015/3/6
7
区间估计
9
0.703 0.883 1.383 1.833 2.262 2.821 3.250 3.690 4.297 4.781
10
0.700 0.879 1.372 1.812 2.228 2.764 3.169 3.581 4.144 4.587
11 12 13 14 15
2015/3/6
0.697 0.695 0.694 0.692 0.691
2015/3/6
19
均数之差可信区间的计算
正常组
1=?
肝炎组
2=? 1- 2 =?
均 数:273.18ug/dl 标准差:9.77ug/dl
2015/3/6
均 数: 231.86ug/dl 标准差:12.17ug/dl
X 1 X 2 41.32
20
与均数之差有关的抽样分布
“均数之差”与“均数之差的标准误”之比,
3.106 3.055 3.012 2.977 2.947 2.5758
3.497 3.428 3.372 3.326 3.286
4.025 3.930 3.852 3.787 3.733
4.437 4.318 4.221 4.140 4.073
18
例4.2
• n=120>100,标准正态分布代替t分布,u0.10=1.645
精确性
– 是指区间的大小(或长短)
兼顾可靠性、精确性
2015/3/6
9
均数的可信区间
• 基础:抽样误差理论 • 从正态分布总体中随机抽取一个样本,则
t
X s
~
t(n1)
X
t值接近于0的可能性较大,远离0的可能性较小, 出现太大的t值和太小的t值的可能性更小,根据t 分布的性质,t有95%可能在-t0.05,v到t0.05,v之间。
13
例4.1
• 随机抽取某地25名正常成年男子,测得该 样本的脉搏均数为73.6次/分,标准差为6.5 次/分,求该地正常成年男子脉搏总体均数 95%的可信区间。
2015/3/6
14
自由度
单侧 双侧
1
2
3
4
5
0.25 0.50 1.000 0.816 0.765 0.741 0.727
0.20 0.40 1.376 1.061 0.978 0.941 0.920
双侧t0.05,23 2.069
(271.18 231.86) 2.069 4.439 32.14, 50.50
2015/3/6
23
正确理解可信区间的涵义
• 可信区间一旦形成,它要么包含总体参数,要么不包 含总体参数,二者必居其一,无概率可言。所谓95% 的可信度是针对可信区间的构建方法而言的。
2015/3/6
17
自由度 n
单侧 双侧
1
2
3
4
5
0.25 0.50 1.000 0.816 0.765 0.741 0.727
0.20 0.40 1.376 1.061 0.978 0.941 0.920
附表2 t 界值表
0.10 0.20 3.078 1.886 1.638 1.533 1.476
2015/3/6
4
参数估计之一:点估计 • 用样本统计量作为总体参数的估计
例如: 用样本均数作为总体均数的一个估计
2015/3/6
5
点估计的缺陷
=?cm, =?cm
x1,x2,x3,x4…… N
X =143.37
s = 5.23 x1,x2,x3…x10
样本含量 n=10
X=142.72
s = 9.2473 x1,x2,x3…x10
2015/3/6
27
可信区间与参考值范围的区别
可信区间用于估计总体参数,总体参数只有一个 。 参考值范围用于估计变量值的分布范围,变量值可能很多
甚至无限 。 95%的可信区间中的95%是可信度,即所求可信区间包含
• 按一定的概率或可信度(1- )用一个区间估计总体 参数所在范围,这个范围称作可信度为1- 的可
信区间(confidence interval, CI),又称置信区间 。 这种估计方法称为区间估计。
2015/3/6
8
可信区间的两个要素
可信度(1-), 可靠性
– 一般取90%,95%。 – 可人为控制。
2015/3/6
-2 -1 0 1 2
25
正确理解可信区间的涵义
• 在区间估计中,总体参数虽未知,但却是 固定的值(且只有一个),而不是随机变 量值 。
2015/3/6
26
下列说法正确吗?
算得总有该该某体区区995参间间5%%数 包 有的的有 含总 9可599体 %信55% % 的参区的 的 可数间可 总 能在,能 体 包该则落 参 含区:在 数 总间该 内 。 体区 。 参间 数。 。 该区间包含总体参数,可信度为95%。