当前位置:文档之家› (精品)医学统计学课件:参数估计

(精品)医学统计学课件:参数估计


6
0.718 0.906 1.440 1.943 2.447 3.143 3.707 4.317 5.208 5.959
7
0.711 0.896 1.415 1.895 2.365 2.998 3.499 4.029 4.785 5.408
8
0.706 0.889 1.397 1.860 2.306 2.896 3.355 3.833 4.501 5.041
-2 -1 0 1 2
25
正确理解可信区间的涵义
• 在区间估计中,总体参数虽未知,但却是 固定的值(且只有一个),而不是随机变 量值 。
26
下列说法正确吗?
算得某95%的可信区间,则:
总体参数有95%的可能落在该区间。 有95%的总体参数在该区间内。 该该区区间间有包9含5%95的%可的能总包体含参总数体。参数。
• 以均数的可信区间为例,其涵义是:如果重复100次 抽样,每次样本含量均为n,每个样本均按 X t0.05, sX 构建可信区间,则在此100个可信区间内,理论上有 95个包含总体均数,而有5个不包含总体均数。
24
95%可信区间的含义
按这种方 法 构建的可 信区 间,理 论上平 均每 100次,有 95 次可以估计 到总体参数。
25
0.684 0.856 1.316 1.708 2.060 2.485 2.787 3.078 3.450 3.725
15
例4.1
本例自由度=12-1=24,经查表得t0.05,24=2.064,则
X t0.05,24 sX 73.6 2.064 6.5 / 25 70.9(次 / 分)
9
0.703 0.883 1.383 1.833 2.262 2.821 3.250 3.690 4.297 4.781
10
0.700 0.879 1.372 1.812 2.228 2.764 3.169 3.581 4.144 4.587
11
0.697 0.876 1.363 1.796 2.201 2.718 3.106 3.497 4.025 4.437
• 即该地7岁男孩平均身高的90%可信区间为: 122.91~124.33(cm) ,可认为该地12岁男孩平均身高在 122.91~124.33之间。
19
均数之差可信区间的计算
正常组
1=?
肝炎组
2=?
1- 2 =?
均 数:273.18ug/dl 标准差:9.77ug/dl
均 数: 231.86ug/dl 标准差:12.17ug/dl
概 率,P 0.05 0.025 0.01 0.10 0.05 0.02 6.314 12.706 31.821 2.920 4.303 6.965 2.353 3.182 4.541 2.132 2.776 3.747 2.015 2.571 3.365
-t
0
t
0.005 0.0025 0.001 0.0005 0.01 0.005 0.002 0.001 63.657 127.321 318.309 636.619 9.925 14.089 22.327 31.599 5.841 7.453 10.215 12.924 4.604 5.598 7.173 8.610 4.032 4.773 5.893 6.869
该区间包含总体参数,可信度为95%。
27
可信区间与参考值范围的区别
可信区间用于估计总体参数,总体参数只有一个 。 参考值范围用于估计变量值的分布范围,变量值可能很
多 甚至无限 。 95%的可信区间中的95%是可信度,即所求可信区间包含
总体参数的可信程度为95% 95%的参考值范围中的95%是一个比例,即所求参考值范
3
参数估计
• 由样本统计量估计总体参数
– 点估计(point estimation) – 区间估计(interval estimation)
4
参数估计之一:点估计 • 用样本统计量作为总体参数的估计
例如: 用样本均数作为总体均数的一个估计
5
点估计的缺陷
=?cm, =?cm
x1,x2,x3,x4…… N
-t
0
t
0.005 0.0025 0.001 0.0005 0.01 0.005 0.002 0.001 63.657 127.321 318.309 636.619 9.925 14.089 22.327 31.599 5.841 7.453 10.215 12.924 4.604 5.598 7.173 8.610 4.032 4.773 5.893 6.869
X t0.05,24 sX 73.6 2.064 6.5 / 25 76.3(次 / 分) 即该地正常成年男子脉搏总体均数的95%可信区间为:
70.9~76.3(次/分) 。用该区间估计该地正常成年男子脉搏总 体均数的可信度为95%。
16
例4.2 某 市 2001 年 120 名 7 岁 男 孩 身 高 均 数
• 个体变异
– 变异越大,区间越宽
• 样本含量
– 样本含量越大,区间越窄
12
当样本含量较大时,例如n>100,t分布近似标准 正态分布,此时可用标准正态分布代替t分布,作
为可信区间的近似计算。相应的100(1-)%可信区
间为:
X u sX , X u sX
13
例4.1 • 随机抽取某地25名正常成年男子,测得该
围包含了95%的正常人。
28
标准差与标准误的联系
都是变异指标。 当n不变时,标准差↑,标准误↑
s s
X
n
29
标准差与标准误的区别 标准差描述原始数据的离散程度; 标准误反映均数的抽样误差大小。
15
0.691 0.866 1.341 1.753 2.131 2.602 2.947 3.286 3.733 4.073
1.6449 1.9600
2.5758
18
例4.2
• n=120>100,标准正态分布代替t分布,u0.10=1.645 X u0.10 sX 123.62 1.645 4.75 / 120 122.91(cm) X u0.10 sX 123.62 1.645 4.75 / 120 124.33(cm)
6
0.718 0.906 1.440 1.943 2.447 3.143 3.707 4.317 5.208 5.959
7
0.711 0.896 1.415 1.895 2.365 2.998 3.499 4.029 4.785 5.408
8
0.706 0.889 1.397 1.860 2.306 2.896 3.355 3.833 4.501 5.041
可信度(1-), 可靠性
– 一般取90%,95%。 – 可人为控制。
精确性
– 是指区间的大小(或长短)
兼顾可靠性、精确性
9
均数的可信区间
• 基础:抽样误差理论 • 从正态分布总体中随机抽取一个样本,则
t X ~t
s
(n1)
X
t值接近于0的可能性较大,远离0的可能性较小, 出现太大的t值和太小的t值的可能性更小,根据t 分布的性质,t有95%可能在-t0.05,v到t0.05,v之间。
10
均数的可信区间
P(t , t t, ) 1
P ( t ,
X s
t
,
) 1
X
P(X t , sX X t , sX ) 1
• 总体均数的(1- )可信区间定义为:
X t , sX , X t , sX
11
影响可信区间大小的因素
• 可信度
– 可信度越大,区间越宽
X =143.37
s = 5.23 x1,x2,x3…x10
样本含量 n=10
X=142.72
s = 9.2473 x1,x2,x3…x10
X =144.07
s = 4.72 x1,x2,x3…x10
6
点估计
• 直接用样本统计量作为总体参数的估计值
–方法简单,但未考虑抽样误差的大小 –在实际问题中,总体参数往往是未知的,但它们是固
MEDICAL STATISTICS 医学统计学
参数估计 Parameter Estimation
主要内容
点估计 区间估计 两个要素 均数可信区间的构建 正确理解可信区间的涵义
2
统计推断的内容
参数估计
(parameter estimation)
假设检验
(hypothesis test)
定的值,并不是随机变量值。而样本统计量随样本的 不同而不同,属随机的。
7
区间估计
•数所在范围,这个范围称作可信度为1- 的可
信区间(confidence interval, CI),又称置信区间 。 这种估计方法称为区间估计。
8
可信区间的两个要素
12
0.695 0.873 1.356 1.782 2.179 2.681 3.055 3.428 3.930 4.318
13
0.694 0.870 1.350 1.771 2.160 2.650 3.012 3.372 3.852 4.221
14
0.692 0.868 1.345 1.761 2.145 2.624 2.977 3.326 3.787 4.140
s X1 X2
122.93 ( 1 1 ) 4.439 12 13
双侧t0.05,23 2.069
(271.18 231.86) 2.069 4.439 32.14, 50.50
23
正确理解可信区间的涵义
• 可信区间一旦形成,它要么包含总体参数,要么不包 含总体参数,二者必居其一,无概率可言。所谓95% 的可信度是针对可信区间的构建方法而言的。
相关主题