PPS抽样PPT精选文档
是说,定额抽样注重的是样本与总体在结构比例上的表面一致性。 (“按事先规定的条件,有目的地寻找”)
• 分层抽样
• 目的:一方面是要提高各层间的异质性与同层中的同质性,另一方面也是 为了照顾到某些比例小的层次,使得所抽样本的代表性进一步提高,误差 进一步减小。
• 其方法:则是完全依据概率原则,排除主观因素,客观地、等概率地到各 层中进行抽样
若按分层抽样的方法,则可以先将其分为本科 院校和专科院校,然后分别从每一类中抽取若 干高校;
3
几种抽样方法的比较 第二阶段:从10所高校中分别抽取500名学生
按整群抽样的方法
(假设其中一个学校有100个班级,每班50名学生)
4
• 多段抽样中,其实暗含了一个假定:即每一个阶段抽 样时,其元素的规模是相同的。
• 如同滚雪球一样,我们可以找到越来越多具有相同性质的群体成员
。
研究退休老人的生活
18
• 非概率抽样其样本的代表性往往较小,误差有 时相当大,且这种误差又无法估计。
• 所以,在大规模的正式研究中,一般很少用非 概率抽样,常常只是在探索性研究中采用。
19
定额抽样与分层抽样的区别
• 定额抽样
• 其目的:在于要抽选出一个总体的“模拟物”, • 其方法:则是通过主观的分析来确定和选择组成这种模拟物的成员。也就
•偶遇抽样 •判断抽样 •定额抽样 •雪球抽样
12
一、偶遇抽样
• 又称作方便抽样或自然抽样
• 是研究者根据现实情况,以自己方便的形式抽取偶然遇到的人作 为调查对象,或者仅仅选择那些离得最近的、最容易找到的人作为 调查对象
• 区别随机抽样: 偶遇抽样没有保证总体中的每一个成员都具有同等的被抽中的概
率。
14
三、定额抽样
• 又称作配额抽样
• 是指调查人员将调查总体样本按一定标志分类或分层,确定各类( 层)单位的样本数额,在配额内任意抽选样本的抽样方式。
例:假设某高校有4000名学生,其中男生占60%,女生占40
%;文科学生和理科学生各占50%;一年级学生占40%、二年 级、三年级、四年级学生分别占30%、20%和l0%。
抽样
• 假设从某市100所高校的50万大学生中, 抽取5000名学生进行环保意识的抽样调查 。
二阶段抽样:大学——学生
2
几种抽样方法的比较 第一阶段:从100所高校中抽取10所
按简单随机抽样或系统抽样的方法,则首先需 要弄到一份100所高校的名单,并对其进行编号 ,然后根据抽签、随机数表或通过计算抽样间 距直接从抽样框中抽取;
入选号码 入样单位
01
4000
4000
000001-004000 002032 单位1
02
5000
9000
004001-009000
03
3200
12200
009001-012200 009786 单位2
04
20000
32200
012201-032200 012234 单位3、4
029824
05 …… 99 100
13
二、判断抽样
• 研究者根据研究的目标和自己主观的分析来选择和确定研究对象的 方法。
• 由于抽样标准的确定带有较大的主观性,所以,此法的运用结果如 何往往与研究者的理论修养、实际经验以及对对象的熟悉程度有很 大关系。
• 在实际中,这种抽样多用于总体规模小、所涉及的范围较窄或时间 、人力等条件有限而难以进行大规模抽样的情况
(二)做法(以二阶段为例):
• 1、在第一阶段,每个群按照其规模(其所含元 素的数量)被给予大小不等的抽取概率。
• 2、到了第二阶段,从每个抽中的群中都抽取同 样多的元素(也是不等概率的)。
• 正是这一大一小,平衡了由于群的规模带来的 概率差异。
8
(三)公 式
每一个元素
群的规模
平均每个群中 所要抽取的元素
现在要用定额抽样方法依上述三个变数抽取一个规模 为100人的样本。
15
依据总体的构成和样本规模,我们得到的定额表 :
年级
男生(60人)
文科(30人)
理科(30人)
女生(40人)
文科(20人)
理科(30人)
一二三四
一二三四
一二三四
一二三四
人数
12 9 6 3
12 9 6 3
8 6 42
8 6 42
16
= 所抽取的群数
被抽中的概率
×
总体的规模
×
群的规模
PPS的做法已经排除了群的规模这一影响因素——第一个分子与第 二个分母相互约掉了——每一个元素的被选中概率变成了:(所抽取 的群数*每个群中所抽取的元素数目)/总体的规模。
这实际上就是样本规模除以总体规模。
9
(四)PPS的具体操作方法:
• 1、在确定的总体内,给每个抽样单位按序编号 ,并且写出它们的规模;
20
21
定额抽样与分层抽样的区别
• 分层抽样是完全依据概率原则,排除主观因素,客观地 、等概率地到各层中进行抽样;
• 配额抽样是由调查人员在配额内主观判断选定样本。 先“分层”(事先确定每层的样本量,即抽选出一个总体
的 “模拟物” ) 再“判断”(在每层中以判断抽样的方法选取抽样个体)
17
四、雪球抽样
• 当我们无法了解总体情况时,可以从总体中少数成员入手,对他们 进行调查,向他们询问还知道哪些符合条件的人;再去找那些人并 再询问他们知道的人。
• 比如第一阶段抽取学校时,暗含了每个学校的规模相 同。
• 在这样的假定下,采取上述几种随机抽样的方法,最 终每名学生被抽中的概率相等。
5
• 但现实生活中,每一个学校包含的学生人数不同,因 而按照上述多段抽样的方法来抽取样本时,最终每名学 生被抽中的概率实际上是不同的。
• (规模不一样大)假设甲学校比较大,有2万名学生,乙学校比较小 ,只有3千名学生。那么当二者在第一阶段都被抽中后,第二阶段分 别从他们中抽取500名学生,
• 甲学校学生被抽中的概率为:(10/100)*(500/20000)=1/400 • 乙学校学生被抽中的概率为:(10/100)*(500/30000)=1/60
6
§4 PPS抽样
一、PPS抽样 (概率与元素的规模大小成比例的抽样)
(一)原理:
• 以阶段性的不等概率换取最终的、总体 的等概率。
7
• 2、累计相加每个抽样单位包含的单位数,并根 据累计相加结果确定每个单位的号码范围;
• 3、采用随机数表的方法或等距抽样的方法选择 号码,号码所对应的单位行第二阶段抽样。
10
用PPS方法抽取第一阶段样本举例
学校序号 学生人数/人 累计人数/人 号码范围
6000 …… 10000 8000
38200 …… 492000 500000
032201-038200
……
……
482001-492000 484551
492001-500000
…… 单位20
11
§5 非概率抽样方法
• 非概率抽样,不是按照概率均等的原则,而是根据人们 的主观经验或其他条件来抽取样本。