当前位置:文档之家› 样本含量估计

样本含量估计

为验证该药疗效,作单侧检验,取=0.05, =0.10,问需纳入多少病例?
要多少病例?若A药组样本含量占整个样本 含量的60%,每组各需多少病例?
1.81012/L = (2 1 ) 1 0 1 2/L = 1 1 0 1 2/L
Z/2=Z0.05/21.96 Z Z0.200.842
n1 n2 2(1.960.1 842)1.8250.951
若要求A药组样本占整个样本含量的60%, 即 Q1 0.6 Q21Q10.4
S群
2
对于定性资料,当总体为无限总体时
S2= (N i/N )(p ip ) 2/(K 1 )
对于定性资料,当总体为有限总体时 S 2 ( 1 k /K ) (N i/N ) (p i p ) 2 /(K 1 )
对于定量资料,无论总体是否有限 S2= (N i/N )(xix) 2/(K 1 )
N (1 .9 6 0 .1 8 4 2 ) 1 .8 2 (0 .6 1 0 .4 1 ) 1 0 6 .0
配对设计均数比较样本含量估计
n
(Z/2
Z
)d
2
例19.5
已知依地酸二钠钙可使铅中毒患者的血红蛋 白升高(30±10)g/L,依据经验,规定治疗 后患者血红蛋白升高值5g/L以上治疗有效。
第19章 样本含量估计
抽样的目的
由样本信息推断总体信息
样本的代表性 抽样时的可行性
样本含量估计的原则
足够的检验效能下的最小样本含量
既能满足医学科研的统计学要求 又能最大限度控制研究成本和研究风险,提高
研究效率
样本含量估计的不同情况
总体参数的估计
常见于调查设计
用样本信息(XS、p)估计总体特征(、)
n=n1+n2,Q1=n1/n, Q2=n2/n 当两组例数相等时,Q1+Q2 =0.5+0.5=1
根据设计需要可以调整比例如:
Q1+Q2 =0.6+0.4或Q1+Q2=0.3+0.7等。
例19.4
某人欲比较A药与B药对改善贫血的作用, 据以往经验,A药可增加红细胞11012/L,B
药可增加红细胞21012/L。若=1.8 1012/L, 取=0.05,=0.10,每组例数相等,问需
二者无差异。取=0.05,=0.10,问应检查
多少煤矿工人?
10 Z/2=Z0.05/21.96 Z=Z0.10 1.282 15
n(1)(1.961 1.0 282)15223.624
独立样本比较的样本含量估计
独立样本均数差的分布
X1~N(1,2) X2 ~N(2,2)
X1X2~N(12,2(n 11n 12))
nn
(Z
2
Z
)
2
估计条件
正态分布,不同总体间方差齐
I型错误概率,一般取0.05(注意单双侧) II型错误概率,一般取0.1或0.2 总体间差距 总体标准差
单样本均数的比较
单样本设计均数比较的样本含量估计(双 侧)
n
(Z/2
Z
)
2
例19.3
已知某地成年男性的血红蛋白含量 (135±15)g/L,拟在当地煤矿工人中对成年男性 进行抽样调查,研究煤矿工人的血红蛋白量水 平与当地一般成年男性无差异。根据专业医学 知识,当血红蛋白含量相差10g/L以内时,认为
影响因素分析或预测
用样本信息完成总体间的比较 相关(或回归)分析
总体参数估计中样本含量的估计
拟调查某地区人群血红蛋白含量(g/L),已 知中国人血红蛋白含量为(120±30)g/L,要
求允许误差不超过5g/L(即=5)。取 =0.05,问需要调查多少患者?
从总体均数为120g/L的总体中进行抽样
样本均数在115~125g/L之间的概率为1-0.05
X ~N(,2)
0.4
单纯随机、
0.3
有放回抽样
0.2
0.1
/2
0
-
Z 2 X
Z
2
n
1-
X ~N(,X2 )
/2
+
x
n
Z /2
2
例19.1
拟调查某地区人群血红蛋白含量(g/L),已知中 国人血红蛋白含量为(120±30)g/L,要求允许
误差不超过5g/L。取=0.05,问需要调查多少
患者?
0.05Z/2Z0.05/21.96 30 5
n1.965302138.3139
估计条件
正态分布、有放回抽样情况下
估计误差 总体标准差(用来计算标准误) 可信度(概率保证程度)1-,一般取95%,
即=0.05
正态分布、无放回抽样情况下(尤其当有 限总体时)
X
* X
Nn* 1n
N1 X N
ncቤተ መጻሕፍቲ ባይዱ
n 1 n
N
估计总体率时样本含量的估计
正态分布、有放回抽样情况下
估计误差
总体标准差 (1)
可信度(概率保证程度)1-
nZ/22Z/22(1)
整群抽样样本含量的估计
正态分布、有放回整群抽样情况下
估计误差 群标准差S群 可信度(概率保证程度)1-
g
Z /2
n1 nQ1 n2 nQ2
2
X1X2~N(12,
Q11Q21 ) n
n
(Z/2
Z
)
2
n
Z/2Z
2
Q11Q21
独立样本比较的样本含量估计
当两样本含量不等时
n
Z/2Z
2
Q11Q21
当两样本含量相等时
2
n 4
Z/2 Z
样本比例 (sample fraction)
10g/L以内时,认为二者无差异。取=0.05, =0.10,问应检查多少煤矿工人?
若两人群实际有差异,也发现了这种差异的最 小样本例数
设血红蛋白服从正态分布
X ~ N(, 2) X ~ N(, x2)
/2


+


1- 检验效能
Z2xZ2n
Z 2n ( ) Z n
() Z x () Z
层)而每层抽取一个调查单位的分层抽样 其抽样误差可由分层抽样的误差公式近似
计算
假设检验中样本含量的估计
已知某地成年男性的血红蛋白含量 (13515)g/L,拟在当地煤矿工人中对成年 男性进行抽样调查,研究煤矿工人的血红 蛋白量水平与当地一般成年男性无差异。 根据专业医学知识,当血红蛋白含量相差
分层抽样的样本含量估计
nNZ 222 /2 ZN 2i/22P i(1NiP Pii()1 WP i i)
N :总体样本含量 Ni :各层(子总体) 样本含量 Pi :各层(子总体)概率估计值 Wi :各层(子总体) 样本含量在总样本含量中
所占比例
等距抽样样本含量估计
相当于分层较多(总体分为同等大小的m个
相关主题