当前位置：文档之家› 样本含量的估计PPT课件

样本含量的估计PPT课件

n1
1.960.52 0.1
9
6.0
4
n2 1.98409.10.5298.50 n3 1.98404.10.5298.45
（二）估计总体率（或比例）时所需的样本大小
n z2/2p1 p
2
p z / 2
p(1 p) n
例18-2：某城市欲调查10岁以上儿童参加夏令
营的比例，在预调查中这个比例是80%，要求正式
的样本统计量与总体参数间或样本统计量间的差值，容许误差既可以用绝对误差来表示，也可用相对误差来表示，容许误差值越小，所需样本量越大。
4.总体标准差σ或总体率π，常根据预试验以及前人的研究结果或统计理论进行估计，σ愈大或π愈
远离0.5，所需样本量越大。
.
7
第二节参数估计中样本含量的估计
（一）估计总体均数时所需的样本大小
2t,
t,
2
Nt,t,2Fra bibliotekQ 11Q 21
样本分配比或抽样比： Q11 Q21 1
.
17
例18-6. 据文献报道：用磷酸咯定肌肉注射治疗间日疟，观察疟虫消失时间，2mg/kg肌注组，平均消失时间为48.5小时；4mg/kg肌注组，平均消失时间为43.3小时。两组平均时间的标准差估计为13小时。欲得出两计量的疟原虫消失时间不同的结论在
.
2
大样本得到的结论要比小样本得到的结论更为精确和可靠，但大样本意味着研究者要付出更多的时间、精力、人力和财力，有时还会导致浪费，样本例数太少，就容易把偶然性或巧合的现象当作必然的规律性现象，也不能正确地估计实验误差，
.
3
克服两种倾向：
1、片面追求增大样本
样本含量过大，不仅会增加实际工作中的困难，对质量的严格控制也不易做到，还会造成人力、物力和时间上的不必要的浪费。此外，样本含量过大还可能引入更多的混杂因素，对研究结果造成不良影响。
358
4 10000 0.10 0.90 0.30 3000.00 0.05
54
5 30000 0.30 0.70 0.46 13747.73 0.25
246
合计 150000
55863.75 1.00
1000
第三节假设检验中样本含量的估计方法
（一）样本均数与总体均数比较
n
t/2,
t,
2
例18-5.某药物研究所研究某新药治疗高血压的疗效，若规定要求用药后舒张压下降1.6kpa，才说明该药有实际疗效。预试验结果：治疗后比治疗前舒张
一、单纯随机抽样的样本含量估计
n t S 2
nc
1
n n
N
（ x t/2S/ n ..,.. t/2S/ n)
式中S 为样本标准差，δ为容许误差， x
α一般取双侧 0.05，
.
8
例18-1. 拟用放射免疫法检测某人群（5000人）血液归流脑特异免疫球蛋白含量，根据文献报道，其样本标准差约为0.5mg/L²，允许误差为0.1mg/L，试按单纯随机抽样估计样本例数。
调查得的样本率与未知实体率相差不超过10%的可
能性不大于0.05。如果用简单随机抽样，需要多少
调查对象？
1.9620.810.8
n
61.47
0.12.
10
二、分层随机抽样的样本含量的估计
按比例分配：
最优分配：
ni n.
Ni .i Ni .i
n Ni. i.(1i)
Ni. i.(1i)
ni
n.
Ni N
piq i
Ni piq i
Ni piq i
Ni piqi
ni
n
Ni Ni
piqi piq i
1 35000 0.04 0.96 0.20 6858.57 0.12
123
2 25000 0.40 0.60 0.49 12247.45 0.22
219
3 50000 0.20 0.80 0.40 20000.00 0.36
.
4
2、忽视应当保证足够的样本含量
样本例数过少，所得指标不够稳定，抽样误差大，结论的可靠性差，用于推断总体的精度差，检验效能低，导致总体中存在的差异未能检验出来，出现假阴性(false negative)结果，这是当前医学研究中值得注意的问题。
.
5
二、样本含量估计的影响因素
1.第一类错误概率大小（或置信度1-），越小，
（均数的抽样）（率的抽样）
.
11
例18-3. 欲在15万人口的居民中调查某病患病率。居民区分5层，样本总含量确定为1000人，根据按比例分配和最优分配分层抽样（以三年前各层患病率的数据作为参考），问各层分别应抽取多少人？
.
12
层
1 2 3 4 5 合计
表 18-1 按比例分配抽样各层应抽取的人数
人口数（Ni）抽样比例（Ni/N）样本含量（ni）
35000
0.233
233
25000
0.167
167
50000
0.333
333
10000
0.067
67
30000
0.200
200
150000(N)
1.000
1000(n)
表 18-2 按最优分配抽样各层应抽取的人数
层人口数三年前 qi=1-pi （Ni）患病率 pi
α=0.05，β=0.2的条件下至少需要观察多少例。
.
18
n12 1.9 60 5..8 24 1 2 3 29.1 84
压差值的标准差为3.0kpa。当α=0.05，检验效能1β=0.8时，试估计需要多少病人进行临床试验？
.
15
n1
1.6
40 5.8 1.6
4 2 322.7 14
n2
1.7
20 0.8 1.6
59 322.3
8
n3
1.7
10 4.8 1.6
5 3 822.2 36
（二）两样本均数比较时
n1
n2
第十八章样本含量的估计
.
1
第一节样本含量估计的意义以及影响因素
一、样本含量估计的意义样本含量（sample size），又称样本容量、
样本大小，是指在实验研究和调查研究中，每个样本所包含的观察对象的数量。
它体现研究设计中重复性原则，其意义在于估计研究中的误差，且抽样误差的大小与样本量有关。足够的样本量也是实验研究中保证组间均衡性的基础。
所需要的样本含量越大，根据研究问题的性质和
研究目的决定I型错误的概率值，通常情况下，取 0.05，可取单侧或双侧。
2.第二类错误概率大小，越小，检验效能1-越大，
所需样本量也越大，一般要求检验效能不低于0.80。
一般只取单侧。在参数估计的样本量估计中不涉及，在假设检验的样本量估计中涉及。
.
6
3.容许误差δ，是指研究者要求的或客观实际存在

e商务文档

样本含量的估计PPT课件

相关文档推荐：