当前位置:文档之家› 抽样方法和样本量估计ppt课件

抽样方法和样本量估计ppt课件



优点2)不同的层中,根据实际情况可以选择不同
的抽样方法

各层观察单位数的分配:等比例分配;最优分配
1) 2) ;
非概率抽样法(non-probability sampling) 虽然在对总体的代表性上很差,在此基础
上做统计推断也不科学,但在很多情况下,
也是适用的。
方便抽样 Convenience Sampling
再从第一部分随机抽取k号观察单位,一次
用相等间隔,从每一部分各抽取一个观察
单位。

系统抽样常作为单纯随机抽样的替代。
整群抽样 cluster sampling

整群抽样是先将总体按照某种与主要研究指标无关的特征划分 为K个群,每个群包含若干观察单位,然后再随机抽取k个群, 由抽取的各个群的全部观察单位组成样本。 与前两种方法不同在于抽样单位不同,不是直接抽取个体,而 是抽群。 单层整群抽样single-stage cluster sampling 多层整群抽样multi-stage cluster sampling 群的变异越小,群越多,抽样误差越小
方便获得的个体即选为样本,样本中每个
个体的获得都是偶然性的。最终,样本不
能够代表总体。不能在此基础上做统计推
断。可以用于研究的初始阶段,目的可以
是为了发现了解相关信息,发现值得研究
的问题,为下一步提出假设准备信息。
配额抽样 Quota Sampling

配额抽样为保证样本的代表性,其样本中具有某种特征的比例几乎和母体中 具有此种特征的比例相等。譬如某大学有10000名学生,我们要抽取1000名。 将学生依年级分成如下四个子母体。 年级 一 二 三 四 学生数 在母体之百分比 样本人数 3200 2600 2200 2000 32% 26% 22% 20% 320 260 220 200

单纯随机抽样就是在总体中以完全随机的方法抽取一部分观察 单位组成样本。常见的办法是先对总体中全部观察单位编号, 然后用抽签、随机数字表或计算机产生的随机数字的方法从中 抽取一部分观察单位组成样本。但是当总体例数较多时,这种 方法不太适用。 单纯随机抽样法是其他概率抽样法的基础。 Random Number Generator
单纯随机抽样 simple random sampling


/statistics/random-number-generator.aspx
系统抽样 systematic sampling

系统抽样又称机械抽样或等距抽样,先将
总体的观察单位按某一顺序分成n个部分,

将样本村(居委会)内全部住户(包括非本地户口住户)按名单顺序编 号(Sampling Frame) ;

根据本村(居委会)应抽取的样本户数确定抽样间隔。 国家样本点抽样间隔 = 本村(居委会)内户数 / 60(四舍五入,取整数) 西部扩点抽样间隔 = 本村(居委会)内户数 / 33 (四舍五入,取整数)

确定抽样住户:首先随机抽一张人民币,取其末四位数,该数除以抽样 间隔后的余数确定为K值,则K≤抽样间隔。K值为被抽第1个住户编号,K 值加抽样间隔为被抽中的第2个住户编号,K值加两个抽样间隔为第3个被 抽住户编号,以此类推。 (Systematic Sampling)
第四次卫生服务总调查医务人员调查样本抽取方法




抽样表(sampling frame)列出所有抽样单位的名册 抽样方法(sampling design) 抽样误差(sampling error)只是因为抽样个体差异产生的随机误差



抽样偏移(sampling bias)造成系统误差,样本层面的系统的偏差,对
总体的代表性偏差

抽样方法可分为概率抽样法与非概率抽样法两类 概率抽样法(probability sampling ) 总体中每个个体被抽中的概率是已知且不为零的,可以计算抽
抽样方法和样本量估计
关于抽样的概念

研究对象(unit of analysis) 根据研究目的确定研究对象。

总体(population) 在明确研究对象的基础上,确定其同质范围。
调查对象(sampling element)被抽中的研究对象。 抽样单位(sampling unit) (如县、乡、村、医疗机构等等) 观察对象(observation unit) 如调查户主,户主填写户中各个家庭成员 情况
专业知识人为选出最有代表性的样本。
滚雪球抽样 Snowball Sampling
通过总体中的一个个体提供的线索找到其他的几个
个体,再通过其他几个个体提供的线索找到更多的 个体。 适用于难以找寻、获得的研究对象 如 HIV/AIDS 其抽样的代表性也局限于被调查者的提供的社会网 络。
第四次卫生服务总调查 家庭健康询问调查样本住户的抽取方法

与分层抽样区别在于,分层抽样是按随机原则在层内抽选样本,而配额抽样则是 由调查人员在配额内主观判断选定样本。
目的抽样 Purposive Sampling
总体量很小时,比如总体中只有三个个体,
此时,随机抽样并不一定能抽到具有代表
性的样本。这种情况下,还不如根据自己
的专业知识或者通过咨询专家借助他们的

样误差并在此基础上做统计推断。
主要包括:简单随机抽样;系统抽样;整群抽样;分层抽样

非概率抽样法(non-probability sampling) 不知道总体中每个个体被抽中的概率,选择样本的过程往往不 是随机的。抽样误差无法计算,选择偏移无法控制。
主要包括:方便抽样;配额抽样;目的抽样;滚雪球抽样





样本量一定情况下,增加群、减少每群中样本数,能提高总样
本的代表性 成本低 代表性差

分层抽样 stratified sampling

分层抽样是先按照对研究指标影响较大的某个特征 将总体分成若干类别(即“层”),再从每一层内
抽取观察单位,合起来组成样本。

优点1)相同样本量,抽样误差最临床医生和护理人员。被调查人员将在家庭健康询问调 查的样本县(市、区)中抽取,涉及到的机构包括样本县(市、区)中的所 有三级综合医院、部分二级综合医院及样本乡镇及街道中的所有社区卫生服 务中心和乡镇卫生院。 二、调查对象的选取 (一)综合医院 1、开展家庭健康调查的样本县(市、区)中的所有三级综合医院及部分县 (市、区)医院参与调查,参与调查的机构名单见培训光盘; 2、每所医院选取临床医务人员30名,其中医生20名,护理人员10名。 (二)社区卫生服务中心及乡镇卫生院 样本街道、样本乡镇中所有的社区卫生服务中心和乡镇卫生院均参与调查; 每所社区卫生服务中心和乡镇卫生院选取临床医务人员10名,其中医生7名, 护理人员3名。如机构内人员数量不满足样本需求时,按实际人数进行调查。 三、样本个体选取原则(Quota Sampling) 1、全院所有临床科室均要抽到; 2、样本选取要求职称分布均匀,兼顾高、中、初级职称。
相关主题