当前位置：文档之家› 1抽样原方法和样本量

1抽样原方法和样本量

反之，所规定的允许误差 L 越小，即调查或试验需要更高的精确度时，所需要的样本量就应越大，这样所得到的结果也越可靠
因此，在实施某一调查或试验时，应确定一个合宜的允许误差 L，必要时应调整所设置的 L 值
对于百分率一类性状的调查或试验所需要的样本量，
由于
，p而q
sp n
L t sp t
pq n
误差分为：系统误差
随机误差
三类
错误
系统误差有规律的偏离影响准确性可以消除
随机误差无规律有统计学意义
影响精确性可以缩小
错误
人为造成
应当消灭
（随机）误差的来源
这里所指误差是指随机误差（简称误差）生物体的复杂性导致了误差的存在，动物体试验又
有更大的误差了解误差其目的是为了缩小误差缩小误差有两个现实意义：
当要求有较高的置信度 99% 时，其样本含量的计算公式为：
n
t02.01s 2 L2
2.582 s2 L2
6.66s2 L2
运用这一公式所得到的 n 值一般不应小于 30，当所得样本量小于 30 时，应作进一步的试运算，直至所得样本量 n 稳定时为止
又例：一总体其标准差为 15.9，试验允许误差为L
一般来讲，当所需要的样本量不大时（n<30），应当进行反复试求，最后使得 n 稳定在某一个值上
例：已知一总体的大致标准差为 9.7，若规定在抽
样时允许存在 L = 2.5 的误差，试求抽样所需的
样本容量
4 9.72
n
60.22 61
2.52
即：在 95% 的置信度下，需要61个个体作为一个样本才能较好地说明问题
提高精确性有效减小试验规模缩小误差，其实质是有效地保证数据的整齐程度试验所得到的数据越整齐，误差就越小，所需样本也就可以越小
误差来源于以下三个方面
试验材料遗传物质的不同一（或样本的本质不同）
试验动物的基因或遗传物质不可能纯合，越是高等的动物其基因越是复杂，所造成的误差也就越大。这是造成误差的最根本原因
建立回归方程的原则是其 r（或其绝对值）或 R 必须很大，以表明用 x 或 xi 估测 y 其效果比较好
而较大的样本在调查或试验中仅测 xi 性状，并将这一样本中所有被测个体的 xi 代入上述回归方程中以求得相应的 y 估计值
这样获得的大样本的 y 估计值，能达到一定的精度这一抽样方法即为双重抽样法
而随着样本容量的增大，试验或调查所需成本、时间、人力、物力等则可能会成倍地增长
因此确定一个合宜的样本容量，使得试验或调查既有一个较好的精确度，又能最大限度地节省人力和时间、财力、物力，是试验或调查必须要考虑的问题
样本容量的确定原则和确定方法总体有限、且很大时，同时注意抽样的代表性，样
本可占总体的千分之一到百分之一总体不很大时，样本占总体的百分之五率的计算和估计，一般要求大样本在试验中，同一水平或同一组合的变异情况越严重，
= 10，求试验所需最小样本量
暂设 t0.05 1.96 2
则
n
4 15.92 102
10
由于 n 较小（<30），故应重求 n 值
查 t 值表，得 t0.05,9 2.262
n 2.2622 15.92 102
12.93 13
继续试算，t0.05,12 2.179
则
n
2.1792 15.92 102
双重抽样法的优点是：
对于复杂性状的调查或试验仅需破坏较小的样本即能获得较大样本的精确性
当目标性状为破坏性性状时，这是唯一行之有效的方法
双重抽样法的适用范围：
遗传学试验、育种学试验、繁殖学试验、生理生化学试验、疾病防治试验，等
双重抽样示意图：
总体
μy σ2
xi y
小样本
yˆ b0 bi xi
整群抽样时，既要考虑群体单位的大小，又要考虑作为样本的群体的多少
原则上，应采取小群体、多群体的抽样方法，因为这样可以更全面地了解总体的情况
多层次抽样时，有一个每个层次样本量的比例的问题，这里需要考虑每一层次的变异情况及各层次的抽样成本，以便对每一层次内单位数进行合理的分配
*在不知道总体的大小和情况时，可以从试验要求的精确性来考虑样本容量：
根据参考文献、他人或自己的经验、专业知识等人为地定出一个样本平均值与总体平均值的离差，即允许误差L：L x
而
L t sx t
s n
其中，t 一般初次总取1.96（置信度为95%）
因此：
n t2
s2 L2
4s2 L2
显然，人为定出的允许误差越大，所需样本量就小
反之，人为定出的允许误差越小（即对试验的要求的精确度越高），所需的样本量就越大
一旦确定了允许误差，就可以用试验或调查结束后得到的样本平均值来告诉人们总体平均值在哪一个可能的范围里面，这一个结论就有了理论依据，不致被人所诘难或质疑
因此确定允许误差得到的样本容量不宜太小（样本容量太小试验或调查的结果比较粗糙，也易引起别人的质疑），但也不需要太大（太大需要大量的经费和人力、物力、时间）
12.00 12
继续试算，t0.0Байду номын сангаас,11 2.201
则
2.2012 15.92
n
102
12.25 12
所求样本量已稳定在 n = 12，即表示抽样以 n = 12 为较宜样本量
从上面两例可以看出，调查或试验所规定的 L（即允许误差，亦即置信半径）越大，所需样本量就可以越小，表示调查或试验越粗糙
试验过程中操作与管理技术的不一致
操作人员的技术、管理水平不可能一致，不同的时间段内操作人员的体力、精神、情绪不可能一致，操作人员的责任心也不可能一致
试验外界条件的不统一
试验动物不可能安排在绝对一致的环境内，对同一组内每一个供试动物的试验措施也不可能绝对一致
误差的控制
针对造成误差的三大原因，采取的控制措施：选择基因型较为纯合的近交系
*关于允许误差 L 的取值允许误差 L 即为置信半径，如何确定允许误差，这
关系到样本容量的大小，也决定了试验或调查的成败
因此允许误差的确定是试验或调查前需要慎重考虑的问题
从前面所介绍的公式和例题中我们已经看出，当总体方差（标准差）基本确定后，样本容量（即试验规模）与允许误差的大小是有直接的关系的
由于求率、成数等所需要的样本容量还是尽可能大一些为好
*抽样误差的估计
抽样误差，一般用标准误来表示，因此，估计抽样误差，就是求标准误的大小
标准误既与标准差有关，也与样本容量有关样本不同，所得到的误差不同抽样方法不同，所得到的抽样误差也不同由于抽样误差表示的是样本平均数与总体平均数之
间的差异，因此，为了使总体平均数的估计更可靠、更精确，应当使用合适的抽样方法标准误求得以后，应计算总体平均值的置信区间（*）
试验设计原理
研究进程
什么是科学研究？任何人想要达到自己的愿望或要求，在充分尊重客
观事实的前提下，所进行的探索性工作研究进程分为如下几个阶段：
科学假设资料收集试验方案的制订及试验设计试验的实施资料的分析及统计研究成果的发表
误差
误差的概念及分类
从试验中获得的数据总或多或少地偏离真值，这种偏离就称为误差
基因纯合的程度依次为：同卵双生个体、自交系、高度近交的近交系、
近交系、全同胞、半同胞、家系、纯种其中，后三种是动物试验中可以实际使用的试验群体两个纯种的杂交后代F1代在某些情况下可以考虑使用
来自同一父亲的半同胞由于群体很大，在遗传学试验、育种学试验、营养学试验、繁殖学试验中经常使用
yˆ
xi
大样本
样本容量样本容量越大，试验结果就越具有代表
性，调查的精确性、准确性也越高
但随着样本容量的增大，抽样或试验的成本也越大，当样本容量大到一定程度时，再增大样本容量，试验或调查其精确性的提高就渐趋缓慢：
当标准差一定时，标准误的大小与样本容量的平方根成反比，样本容量较小时，随着样本容量的增大，标准误会急剧减小，但当样本容量大到一定程度后再增大样本容量，标准误的减小将会变得越来越慢，即继续增大样本容量，试验精确性的提高其效能将逐步下降
以此类推二级及二级以上的抽样就称为多层次抽样多层次抽样方法适合于资源调查、遗传学试验、育
种学试验、传染病（寄生虫病）调查、流行病学调查、经济学调查，等
*三、双重抽样法
当所研究的性状比较复杂，或所需经费较多，或须将试验动物宰杀后才能测定，因而不大可能进行重复性试验，或采用直接抽样试验时有较大的难度，可采用双重抽样法
采用双重抽样法，首先将所需要进行研究的性状定为目标性状（或称为靶性状），用 y 表示，然后根据文献或其他方法确定一个或几个简单易测、不具破坏性、与靶性状相关性比较紧密的性状，这些性状称为辅助性状，用 xi 表示
从总体中抽取两个样本，一个大样本，一个小样本
先对小样本进行调查，或先用小样本进行试验，对这一小样本既测 y 性状，同时也测 xi 性状，获得 n 对 y 和 xi，并建立 xi 与 y 的回归方程，最简单的回归方程就是只有一个 xi 的简单回归方程，也可以是曲线回归方程，也可以建立多元回归方程
样本单位群的抽取既可以用随机抽样法得到，也可以有选择地取得
在整群抽样的基础上，对抽得的样本单位群不作全面调查，或不是整个样本单位群进入试验，而是在样本单位中继续抽取一定量的个体（数据）组成样本，这就是二级抽样
如果二级抽样得到的不是个体（数据），而是更小的单位群，再从中进行抽样，这就是三级抽样
因此
95%
置信度下的样本量为：n
4 pq L2

e商务文档

1抽样原方法和样本量

相关文档推荐：