样本含量的估计PPT课件
n1
1.960.52 0.1
9
6.0
4
n2 1.98409.10.5298.50 n3 1.98404.10.5298.45
(二)估计总体率(或比例)时所需 的样本大小
n z2/2p1 p
2
p z / 2
p(1 p) n
例18-2:某城市欲调查10岁以上儿童参加夏令
营的比例,在预调查中这个比例是80%,要求正式
的样本统计量与总体参数间或样本统计量间的 差值,容许误差既可以用绝对误差来表示,也 可用相对误差来表示,容许误差值越小,所需 样本量越大。
4.总体标准差σ或总体率π,常根据预试验以及前 人的研究结果或统计理论进行估计,σ愈大或π愈
远离0.5,所需样本量越大。
.
7
第二节 参数估计中样本含量的估计
(一)估计总体均数时所需的样本大小
2t,
t,
2
Nt,t,2Fra bibliotekQ 11Q 21
样本分配比或抽样比: Q11 Q21 1
.
17
例18-6. 据文献报道:用磷酸咯定肌肉注射治疗 间日疟,观察疟虫消失时间,2mg/kg肌注组,平均 消失时间为48.5小时;4mg/kg肌注组,平均消失时 间为43.3小时。两组平均时间的标准差估计为13小 时。欲得出两计量的疟原虫消失时间不同的结论在
.
2
大样本得到的结论要比小样本得到的结论 更为精确和可靠,但大样本意味着研究者要付 出更多的时间、精力、人力和财力,有时还会 导致浪费,样本例数太少,就容易把偶然性或 巧合的现象当作必然的规律性现象,也不能正 确地估计实验误差,
.
3
克服两种倾向:
1、片面追求增大样本
样本含量过大,不仅会增加实际工作中的困难,对 质量的严格控制也不易做到,还会造成人力、物力和 时间上的不必要的浪费。此外,样本含量过大还可能 引入更多的混杂因素,对研究结果造成不良影响。
358
4 10000 0.10 0.90 0.30 3000.00 0.05
54
5 30000 0.30 0.70 0.46 13747.73 0.25
246
合计 150000
55863.75 1.00
1000
第三节 假设检验中样本含量的估计方法
(一)样本均数与总体均数比较
n
t/2,
t,
2
例18-5.某药物研究所研究某新药治疗高血压的疗 效,若规定要求用药后舒张压下降1.6kpa,才说明该 药有实际疗效。预试验结果:治疗后比治疗前舒张
一、单纯随机抽样的样本含量估计
n t S 2
nc
1
n n
N
( x t/2S/ n ..,.. t/2S/ n)
式中S 为样本标准差,δ为容许误差, x
α一般取双侧 0.05,
.
8
例18-1. 拟用放射免疫法检测某人群(5000人)血液 归流脑特异免疫球蛋白含量,根据文献报道,其样 本标准差约为0.5mg/L²,允许误差为0.1mg/L,试 按单纯随机抽样估计样本例数。
调查得的样本率与未知实体率相差不超过10%的可
能性不大于0.05。如果用简单随机抽样,需要多少
调查对象?
1.9620.810.8
n
61.47
0.12.
10
二、分层随机抽样的样本含量的估计
按比例分配:
最优分配:
ni n.
Ni .i Ni .i
n Ni. i.(1i)
Ni. i.(1i)
ni
n.
Ni N
piq i
Ni piq i
Ni piq i
Ni piqi
ni
n
Ni Ni
piqi piq i
1 35000 0.04 0.96 0.20 6858.57 0.12
123
2 25000 0.40 0.60 0.49 12247.45 0.22
219
3 50000 0.20 0.80 0.40 20000.00 0.36
.
4
2、忽视应当保证足够的样本含量
样本例数过少,所得指标不够稳定,抽样误差大, 结论的可靠性差,用于推断总体的精度差,检验效能 低,导致总体中存在的差异未能检验出来,出现假阴 性(false negative)结果,这是当前医学研究中值得注意 的问题。
.
5
二、样本含量估计的影响因素
1.第一类错误概率大小(或置信度1-),越小,
(均数的抽样) (率的抽样 )
.
11
例18-3. 欲在15万人口的居民中调查某病患病率。 居民区分5层,样本总含量确定为1000人,根据按比 例分配和最优分配分层抽样(以三年前各层患病率 的数据作为参考),问各层分别应抽取多少人?
.
12
层
1 2 3 4 5 合计
表 18-1 按比例分配抽样各层应抽取的人数
人口数(Ni) 抽样比例(Ni/N) 样本含量(ni)
35000
0.233
233
25000
0.167
167
50000
0.333
333
10000
0.067
67
30000
0.200
200
150000(N)
1.000
1000(n)
表 18-2 按最优分配抽样各层应抽取的人数
层 人口数 三年前 qi=1-pi (Ni) 患病率 pi
α=0.05,β=0.2的条件下至少需要观察多少例。
.
18
n12 1.9 60 5..8 24 1 2 3 29.1 84
压差值的标准差为3.0kpa。当α=0.05,检验效能1β=0.8时,试估计需要多少病人进行临床试验?
.
15
n1
1.6
40 5.8 1.6
4 2 322.7 14
n2
1.7
20 0.8 1.6
59 322.3
8
n3
1.7
10 4.8 1.6
5 3 822.2 36
(二)两样本均数比较时
n1
n2
第十八章 样本含量的估计
.
1
第一节 样本含量估计的意义以及影响因素
一、样本含量估计的意义 样本含量(sample size),又称样本容量、
样本大小,是指在实验研究和调查研究中,每个样 本所包含的观察对象的数量。
它体现研究设计中重复性原则,其意义在于 估计研究中的误差,且抽样误差的大小与样本量有 关。足够的样本量也是实验研究中保证组间均衡性 的基础。
所需要的样本含量越大,根据研究问题的性质和
研究目的决定I型错误的概率值,通常情况下,取 0.05,可取单侧或双侧。
2.第二类错误概率大小,越小,检验效能1-越大,
所需样本量也越大,一般要求检验效能不低于0.80。
一般只取单侧。在参数估计的样本量估计中不涉 及,在假设检验的样本量估计中涉及。
.
6
3.容许误差δ,是指研究者要求的或客观实际存在