当前位置:文档之家› 贾俊平《统计学》复习笔记课后习题详解及典型题详解(数据的搜集)【圣才出品】

贾俊平《统计学》复习笔记课后习题详解及典型题详解(数据的搜集)【圣才出品】

第2章数据的搜集
2.1 复习笔记
一、数据的来源
1.数据的直接来源
数据的直接来源是指通过直接调查或实验活动直接获得一手数据,直接来源的数据又分为调查数据和实验数据。

它们的不同之处在于:
(1)调查数据为通过调查方法得到的数据,而实验数据为通过实验方法得到的数据。

(2)调查数据通常是针对社会现象而获取的,而实验数据大多是针对自然现象而获取的;
(3)调查数据通常取自有限总体,即总体所包含的个体单位是有限的;而实验数据是指在实验中通过控制实验对象所搜集到的变量的数据。

2.数据的间接来源
(1)间接来源的数据(二手资料)
如果与研究内容有关的原信息已经客观存在,只是对这些原信息重新加工、整理,使之成为进行统计分析可以使用的数据,则称为间接来源的数据。

(2)二手资料的优点
搜集方便;数据采集快;采集成本低。

(3)二手资料的作用
分析所要研究的问题;提供研究问题的背景,帮助研究者更好地定义问题,检验和回答某些假设和疑问,寻找研究问题的思路和途径。

(4)二手资料的局限性
针对性不够;资料的相关性不够;口径可能不一致;数据也许不准确,也许过时等。

(5)对二手资料进行评估的内容
①资料是谁搜集的?数据搜集者的实力和社会信誉度会在一定程度上影响数据说服力;
②搜集的目的是什么?为了某种特殊的利益而搜集的数据是值得怀疑的;
③数据是怎样搜集的?搜集数据的方法有很多,不同方法所采集到的数据,其解释力和说服力都是不同的。

如果不了解搜集数据所用的方法,很难对数据的质量做出客观的评价。

数据的质量来源于数据的产生过程;
④什么时候搜集的?过时的数据的说服力会受到质疑。

(6)使用二手数据的注意事项
使用二手数据,要注意数据的定义、含义、计算口径和计算方法,避免错用、误用、滥用。

在引用二手数据时,应注明数据的来源,以尊重他人的劳动成果。

二、调查方法
1.概率抽样和非概率抽样
(1)概率抽样
概率抽样(随机抽样):指遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本。

①概率抽样的特点
a.抽样时是按一定的概率以随机原则抽取样本,随机原则就是在抽取样本时排除主观
上有意识地抽取调查单位,使每个单位都有一定的机会被抽中;
b.每个单位被抽中的概率是已知的,或是可以计算出来的;
c.当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率。

②概率抽样的优点
概率抽样最主要的优点是可以依据调查结果,计算估计量误差,从而得到对总体目标量进行推断的可靠程度。

还可以按照要求的精确度,计算必要的样本单位数目。

这些为统计估计结果的评估提供了有力的依据。

③概率抽样与等概率抽样的区别
概率抽样是指总体中的每个单位都有一定的非零概率被抽中,单位之间被抽中的概率可以相等,也可以不等。

等概率抽样是指总体中的每个单位都以相等的非零概率被抽中,如果单位之间被抽中的概率不等,则称为不等概率抽样。

④概率抽样的方式
a.简单随机抽样
抽样框:抽样框通常包括所有总体单位的信息,它不仅提供了备选单位的名单以供抽选,还是计算各个单位入样概率的依据。

简单随机抽样:也称为纯随机抽样,指从包括总体N个单位的抽样框中随机地、一个一个地抽取n个单位作为样本,每个单位的入样概率是相等的。

简单随机抽样是一种最基本的抽样方法,是其他抽样方法的基础。

特点:简单、直观,在抽样框完整时,可以直接从中抽取样本,由于每个单位被选中概率相同,能比较方便的用样本统计量对目标量进行估计及计算估计量误差。

局限性:第一,它要求将包含所有总体单位的名单作为抽样框,当总体单位个数N很
大时,很难构造这样的抽样框;第二,根据这种方法抽出的单位很分散,给实施调查增加了困难;第三,没有利用其他辅助信息以提高估计的效率。

b.分层抽样
概念:分层抽样是将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本,将各层的样本结合起来,对总体的目标量进行估计。

优点:第一,保证样本中含有总体各种特征的抽样单位,样本的结构与总体的结构相近,有效地提高估计的精度;第二,在一定条件下使组织实施调查更加方便(当层的划分是按行业或行政区划进行时);第三,在对总体参数进行估计的同时,也可以对各层的目标量进行估计等等。

缺点:整体差异不明显时不适用,在使用时需要与其他抽样方法综合使用。

c.整群抽样
概念:将总体中若干个单位合并为组,这样的组称为群。

抽样时直接抽取群,然后对中选群中的所有单位全部实施调查,这样的抽样方法称为整群抽样。

优点:与简单随机抽样相比,整群抽样的优点在于简化了编制抽样框的工作量,并且调查的地点相对集中,减少调查费用,易于调查实施。

缺点:整群抽样的主要缺点是估计的精度较差。

在样本量相同的情况下,整群抽样的抽样误差通常比较大,所以要得到与简单随机抽样相同的精度,需要增加基本调查单位。

d.系统抽样
概念:将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先制定好的规则确定其他样本单位,这种抽样方法称为系统抽样。

优点:操作简便,如果有辅助信息,对总体内的单位进行有组织的排列,可以有效地提
高估计的精度。

缺点:对估计量方差的估计比较困难。

e.多阶段抽样
概念:采用类似整群抽样的方法,首先抽取群,但并不是调查群内的所有单位,而是再进一步抽样,从选中的群中抽取出若干个单位进行调查。

因为取得这些接受调查的单位需要两个步骤,所以将这种抽样方式称为二阶段抽样,将这种方法推广,使抽样的阶段数增多,就称为多阶段抽样。

优点:具有整群抽样的优点。

第一,样本相对集中,减少调查费用;第二,不需要包含所有低阶段抽样单位的抽样框;第三,由于实行了再抽样,使调查单位在更广泛的范围内展开。

适用范围:在较大规模的抽样调查中,多阶段抽样是经常被采用的方法。

(2)非概率抽样
非概率抽样是相对于概率抽样而言的,指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。

表2-1 非概率抽样的方式
抽样方式
(3)概率抽样与非概率抽样的比较
①概率抽样是依据随机原则抽选样本,样本统计量的理论分布存在,而非概率抽样不是依据随机原则抽选样本,样本统计量的分布是不确切的。

②概率抽样可以根据调查的结果对总体的有关参数进行估计,计算估计误差,得到总体参数的置信区间,而非概率抽样无法做到这些。

③概率抽样适合调查目的在于掌握研究对象总体的数量特征的调查,而非概率抽样适合探索性的研究,调查的结果用于发现问题,为更深入的数量分析做准备。

④概率抽样的技术含量高,要求有较高的统计学专业知识,调查的成本比较高,而非概率抽样操作简便,时效快,成本低,对抽样中的统计专业技术要求不是很高。

2.搜集数据的基本方法
样本单位确定之后,对这些单位实施调查,即从样本单位那里得到所需要的数据,可以采用不同的方法,搜集数据的基本方法有以下几种。

相关主题