PPS抽样
若按分层抽样的方法,则可以先将其分为本科院
校和专科院校,然后分别从每一类中抽取若干高
校;
2015-4-10
几种抽样方法的比较 第二阶段:从10所高校中分别抽取500名学生
按整群抽样的方法
(假设其中一个学校有100个班级,每班50名学生)
2015-4-10
•
多段抽样中,其实暗含了一个假定:即每一个阶段抽 样时,其元素的规模是相同的。
抽样
•
假设从某市100所高校的50万大学生中, 抽取5000名学生进行环保意识的抽样调查 。
二阶段抽样:大学——学生
2015-4-10
几种抽样方法的比较 第一阶段:从100所高校中抽取10所
按简单随机抽样或系统抽样的方法,则首先需要
弄到一份100所高校的名单,并对其进行编号, 然后根据抽签、随机数表或通过计算抽样间距直 接从抽样框中抽取;
年级
人数
一 二 三 四
一 二 三 四
一 二 三 四
一 二 三 四
12
9
6
3
12
9
6
3
8
6
428源自6422015-4-10
定额抽样与分层抽样的区别
• 分层抽样是完全依据概率原则,排除主观因素,客观地 、等概率地到各层中进行抽样;
• 配额抽样是由调查人员在配额内主观判断选定样本。
先“分层”(事先确定每层的样本量,即抽选出一个总体
• 区别随机抽样:
偶遇抽样没有保证总体中的每一个成员都具有同等的被抽中的概
率。
2015-4-10
二、判断抽样
• 研究者根据研究的目标和自己主观的分析来选择和确定研究对象的
方法。
• 由于抽样标准的确定带有较大的主观性,所以,此法的运用结果如 何往往与研究者的理论修养、实际经验以及对对象的熟悉程度有很 大关系。
研究退休老人的生活
2015-4-10
• 非概率抽样其样本的代表性往往较小,误差有时
相当大,且这种误差又无法估计。
• 所以,在大规模的正式研究中,一般很少用非概
率抽样,常常只是在探索性研究中采用。
2015-4-10
定额抽样与分层抽样的区别
• 定额抽样
•
•
其目的:在于要抽选出一个总体的“模拟物”,
其方法:则是通过主观的分析来确定和选择组成这种模拟物的成员。也就是 说,定额抽样注重的是样本与总体在结构比例上的表面一致性。 (“按事先规定的条件,有目的地寻找”)
概率差异。
2015-4-10
(三)公 式
平均每个群中 所要抽取的元素
每一个元素
群的规模
= 所抽取的群数 ×
被抽中的概率
总体的规模
×
群的规模
PPS的做法已经排除了群的规模这一影响因素——第一个分子与第 二个分母相互约掉了——每一个元素的被选中概率变成了:(所抽取的 群数*每个群中所抽取的元素数目)/总体的规模。
•
(概率与元素的规模大小成比例的抽样)
以阶段性的不等概率换取最终的、总体 的等概率。
2015-4-10
(二)做法(以二阶段为例):
• 1、在第一阶段,每个群按照其规模(其所含元
素的数量)被给予大小不等的抽取概率。
• 2、到了第二阶段,从每个抽中的群中都抽取同
样多的元素(也是不等概率的)。
• 正是这一大一小,平衡了由于群的规模带来的
• 分层抽样
• 目的:一方面是要提高各层间的异质性与同层中的同质性,另一方面也是为 了照顾到某些比例小的层次,使得所抽样本的代表性进一步提高,误差进一 步减小。 • 其方法:则是完全依据概率原则,排除主观因素,客观地、等概率地到各层
中进行抽样
2015-4-10
2015-4-10
的
“模拟物” ) 再“判断”(在每层中以判断抽样的方法选取抽样个体)
2015-4-10
四、雪球抽样
• 当我们无法了解总体情况时,可以从总体中少数成员入手,对他们
进行调查,向他们询问还知道哪些符合条件的人;再去找那些人并 再询问他们知道的人。
• 如同滚雪球一样,我们可以找到越来越多具有相同性质的群体成员。
%;文科学生和理科学生各占50%;一年级学生占40%、二 年级、三年级、四年级学生分别占30%、20%和l0%。 现在要用定额抽样方法依上述三个变数抽取一个规模 为100人的样本。
2015-4-10
依据总体的构成和样本规模,我们得到的定额表 :
男生(60人) 文科(30人) 理科(30人)
女生(40人) 文科(20人) 理科(30人)
•
比如第一阶段抽取学校时,暗含了每个学校的规模相 同。
•
在这样的假定下,采取上述几种随机抽样的方法,最
终每名学生被抽中的概率相等。
2015-4-10
•
但现实生活中,每一个学校包含的学生人数不同,因
而按照上述多段抽样的方法来抽取样本时,最终每名学
生被抽中的概率实际上是不同的。
• (规模不一样大)假设甲学校比较大,有2万名学生,乙学校比较小
2015-4-10
§5 非概率抽样方法
• 非概率抽样,不是按照概率均等的原则,而是根据人们 的主观经验或其他条件来抽取样本。
•偶遇抽样
•判断抽样
•定额抽样
•雪球抽样
2015-4-10
一、偶遇抽样
• 又称作方便抽样或自然抽样
•
是研究者根据现实情况,以自己方便的形式抽取偶然遇到的人作 为调查对象,或者仅仅选择那些离得最近的、最容易找到的人作为 调查对象
这实际上就是样本规模除以总体规模。
2015-4-10
(四)PPS的具体操作方法:
• 1、在确定的总体内,给每个抽样单位按序编号 ,并且写出它们的规模; • 2、累计相加每个抽样单位包含的单位数,并根 据累计相加结果确定每个单位的号码范围; • 3、采用随机数表的方法或等距抽样的方法选择 号码,号码所对应的单位入选第一阶段样本; • 4、在被抽取的单位中,按照抽样元素的多少进
,只有3千名学生。那么当二者在第一阶段都被抽中后,第二阶段分 别从他们中抽取500名学生,
•
•
甲学校学生被抽中的概率为:(10/100)*(500/20000)=1/400
乙学校学生被抽中的概率为:(10/100)*(500/30000)=1/60
2015-4-10
§4 PPS抽样
一、PPS抽样
(一)原理:
行第二阶段抽样。
2015-4-10
用PPS方法抽取第一阶段样本举例
学校序号 01 02 03 04 学生人数/人 4000 5000 3200 20000 累计人数/人 4000 9000 12200 32200 号码范围 000001-004000 004001-009000 009001-012200 012201-032200 009786 012234 029824 05 …… 99 100 6000 …… 10000 8000 38200 …… 492000 500000 032201-038200 …… 482001-492000 492001-500000 …… 484551 …… 单位20 单位2 单位3、4 入选号码 002032 入样单位 单位1
• 在实际中,这种抽样多用于总体规模小、所涉及的范围较窄或时间
、人力等条件有限而难以进行大规模抽样的情况
2015-4-10
三、定额抽样
• 又称作配额抽样
• 是指调查人员将调查总体样本按一定标志分类或分层,确定各类( 层)单位的样本数额,在配额内任意抽选样本的抽样方式。
例:假设某高校有4000名学生,其中男生占60%,女生占40