社会统计学第一章导论1、统计学是收集、分析、表述和解释数据的科学。
2、社会统计方法是指搜集、整理与分析资料的研究技术或手段。
3、大量观察是就总体中足够多的单位进行调查和综合分析,用以反映社会总体的数量特征,大量观察法是统计调查阶段的重要方法。
4、统计按其内容主要包括两个方面:描述统计和推断统计。
5、描述统计就是讨论范围仅以搜集的资料本身为限,而不予以扩大,是统计分析方法的基础。
内容有搜集数据、整理数据、展示数据、描述性分析,目的在于描述数据特征、找出数据的基本规律。
6、推断统计主要是依据概率论,研究如何依据有限资料对总体性质作推断,从而使统计的功能大为扩充。
内容有参数估计和假设检验,目的在于对总体特征作出推断。
7、参数估计,即由样本的指标数值推断总体的相应的指标数值,包括点估计和区间估计。
8、假设检验,即就社会研究中提出的某种假设应用抽样方法来加以统计检验。
9、程序是指研究工作的顺序和步骤,是人们根据客观法则和人的认识规律而作出的一种逻辑安排。
10、社会统计工作的程序:①制定计划②统计调查③统计整理④统计分析⑤统计报告11、统计调查就是按照统计研究所预定的目的和任务,运用各种调查的组织形式,有组织、有计划地向调查对象搜集原始资料的工作过程。
12、统计整理就是根据统计研究的目的和任务,对调查所得的资料进行加工整理,使之条理化、系统化。
13、统计分析是对研究对象进行定量分析。
14、统计报告就是将所得结果用文字报告的形式表达出来。
15、统计数据是对现象进行计量的结果,不是指单个的数字,而是由多个数据构成的数据集,不仅仅是指数字,它可以是数字的,也可以是文字的。
16、统计数据的分类:①按计量层次分:分类数据、顺序数据、数值型数据②按收集方法分:观察的数据、试验的数据③按时间状况分:截面数据、时序数据17、分类数据:对事物进行分类的结果,数据表现为类别,用文字来表述,例如,人口按性别分为男、女两类。
18、顺序数据:对事物类别顺序的测度,数据表现为类别,用文字来表述,例如,产品分为一等品、二等品、三等品、次品等。
19、数值型数据:对事物的精确测度,结果表现为具体的数值,例如:身高为175cm、168cm、183cm。
20、观测的数据:通过调查或观测而收集到的数据,在没有对事物人为控制的条件下而得到的,有关社会经济现象的统计数据几乎都是观测数据。
21、试验的数据:在试验中控制试验对象而收集到的数据,比如,对一种新药疗效的试验,对一种新的农作物品种的试验等,自然科学领域的数据大多数都为试验数据。
22、截面数据:在相同或近似相同的时间点上收集的数据,描述现象在某一时刻的变化情况,比如,2002年我国各地区的国内生产总值数据。
23、时间序列数据:在不同时间上收集到的数据,描述现象随时间变化的情况,比如,1996年至2002年国内生产总值数据。
24、总体,就是作为统计研究对象的、由许多具有共性的单位构成的整体,构成总体的每一个个体称为总体单位,简称单位,也称为个体。
也可以说是所研究的全部元素的集合,其中每一个元素称为个体。
总体具有三个基本特征:大量性、同质性和变异性。
25、总体按其包括的单位的数目是有限还是无限,分成有限总体和无限总体。
有限总体的范围能够明确确定,且元素的数目是有限的,无限总体所包括的元素是无限的,不可数的。
26、无限总体是指在一个合理时间内不能将全部单位一一列举。
27、样本是从总体中抽取的一部分元素的集合,构成样本的元素的数目称为样本容量。
从总体中选出样本的过程叫做抽样。
28、总体的每个单位都具有许多属性和特征,说明总体单位属性或数量特征的名称在统计上称为标志。
如在学生总体中,每个学生的性别、籍贯、年龄、文化程度、民族等特征,就是该总体单位的标志。
29、凡能用数量的多少来表示的标志,称为数量标志,如年龄,它们用以说明事物量的规定性。
30、凡不能用数量的多少来表示而只能用文字表述的标志,称为品质标志,如性别,它们用以说明事物质的规定性。
31、标志按变异情况可以分为不变标志和可变标志。
32、不变标志是构成总体同质性的基础,任何个体只有在某些预设的不变标志的基础上才能集合成一个总体。
33、可变标志是统计研究真正所关心的,可变的品质标志无法用数值表示,我们称之为变项;可变的数量标志能够用数值表示,我们称之为变量。
34、变量是可变的数量标志,如年龄;变量值是它的大小,如某甲年龄是18岁,某乙年龄时25岁等等。
35、通过调查得来的关于某一数量标志的一系列数值,在统计上又称数据。
36、变量的取值有连续和非连续之分。
凡是相邻的两个变量值之间可以连续不断分割的变量,称为连续变量。
凡是各变量值之间是以整数断开的变量,称为离散变量。
离散变量可以精确计算,其值可以是精确值。
连续变量不可能精确计量,其值都是近似值。
37、分类变量:说明事物类别的一个名称。
38、顺序变量:说明事物有序类别的一个名称。
39、数值型变量:说明事物数字特征的一个名称。
40、当品质标志的变异性用离散变量来表达时,这个变量可称为虚拟变量。
此时,其数值大小只是代码,并无真实意义。
41、自变量是作为变化依据的变量,而因变量是随自变量而发生对应变化的变量。
42、变量按其性质分又可分为确定型变量和随机变量。
在相同条件下进行观测,其可能实现的值(或观测值)不止一个,有这种性质的变量称为随机变量。
确定型变量条件一定,实现的值就确定了。
43、统计指标是反映总体(或样本总体)的数量特征的概念或范畴。
例如中国国土面积是9.6*10^6 km^2,其中“中国国土面积”是指标名称,“9.6*10^6 km^2”则是指标数值。
44、统计指标按其内容或作用分,可分为数量指标和质量指标。
数量指标说明总体在外延上的数量特征,如人口总数、居民收入、产品产量等,一般都以总量指标的形式出现。
质量指标说明总体在内涵上的数量特征,如人口密度、劳动生产率、产品价格等,一般都以相对指标或平均指标的形式出现。
45、统计指标按其数值的三种表现形式,又有总量指标、相对指标和平均指标之分。
总量指标一般由统计汇总而来,它是研究问题的基础。
相对指标和平均指标一般由总量指标派生而来。
46、参数:研究者想要了解的总体的某种特征值。
47、统计量:根据样本数据计算出来的一个量。
48、典型的统计软件:SAS、SPSS、MINITAB、STA TISTICA、Excel第二章社会统计资料的收集1、原始资料是指由调查者直接收集的、未经加工整理而保持其原本状态的资料。
2、次级资料是指经他人加工整理,可以在一定程度上被引用来说明总体特征的资料。
3、凡某一特定时刻的资料称为静态资料;凡某时期内变动累计的资料称为动态资料。
4、统计调查从调查目的上分,可以分成一般调查和专项调查。
一般调查是为了取得用于多种目的的统计数据;专项调查则是为了取得用于研究、分析某些专门问题的统计资料。
5、统计调查从调查范围上分,可以分成全面调查和非全面调查,全面调查对构成调查对象的总体中的所有个体进行调查登记,无一遗漏;非全面调查则只对构成调查对象的总体中的部分单位进行调查登记。
6、统计调查按调查登记的时间是否连续,可以分成经常性调查和一次性调查。
经常性调查即连续调查,是对调查对象的变化进行连续不断地登记;一次性调查即不连续调查,是间隔一段较长时间进行的调查,但不是指调查只进行一次。
7、统计调查按照收集资料的具体方法分,可以分为问询法、观察法、报告法、实验法、文献法等。
问询法是调查者运用访谈、问卷、电话、通讯等方式,直接或间接向被调查者询问,并根据被调查者的答复来取得资料的一种调查方法;观察法是调查者为获得第一手资料,在现场对调查对象的情况直接观察、记录的一种调查方法;报告法又称凭证法,就是以各种原始记录为依据,由被调查者或单位按照有关规定和隶属关系,逐级向上提供资料的一种方法;实验法是根据一定的研究目的,选择一组研究对象,人为地改变与控制某些因素,然后观察其后果的一种方法;文献法则是通过记录社会现象的各种载体,从中获取所需信息的一种调查方法。
8、统计调查的组织形式:普查、重点调查、典型调查、抽样调查。
9、普查即全面调查,就是对研究对象的全体做无一遗漏的逐个调查。
严格遵守以下基本原则:①确定普查时点;②规定普查登记的合适时期;③统一规定普查的项目和指标;④普查的间隔应有规律性。
10、重点调查就是在研究现象的总体中,选取其中的重点单位进行调查。
所谓重点单位,就是在总体中虽然所占数目不多,但这些单位的被研究的标志总量在总体的标志总量中却占有很大比重。
11、典型调查就是根据调查的目的和要求,在对所研究对象进行初步全面分析的基础上,从中选择有代表性的单位,做周密细致的调查。
12、抽样调查是按照科学的原理和计算,从若干单位组成的事物总体中,抽取部分样本单位来进行调查、观察,然后用所得到的调查结果来推断总体。
13、抽样按其具体组织形式可分为两大类:随机抽样和非随机抽样。
14、遵循随机原则的抽样叫随机抽样。
15、随机抽样有:简单随机抽样、等距抽样、分层抽样、整群抽样。
16、简单随机抽样,首先,它对总体中所有单位不进行分组只进行编号;然后为组成样本,它赋予总体中每一个单位以相同的被抽中的机会。
17、简单随机抽样按对抽取单位是否回置,可分为回置抽样和不回置抽样。
18、回置抽样是从总体中抽取一个单位,登记后又放回总体中去,然后再抽下一个单位。
可以保证每一总体单位有相同被抽到的机会。
19、等距抽样又称机械抽样或系统抽样,是将总体中各单位按一定标志或次序排列成为图形或一览表式,然后从随机选择的第一个单位开始,按相等的距离或间隔抽取样本单位。
20、分层抽样又称类型抽样,是将总体单位按其属性特征分成若干类型或层,然后在类型或层中随机抽取样本。
21、整群抽样又称聚类抽样,是从总体中成群成组地抽取调查单位,而不是一个一个地抽取调查单位。
22、多阶段抽样:先抽取群,但并不是调查群内的所有单位,而是再进行一步抽样,从选中的群中抽取出若干个单位进行调查。
23、非随机抽样:方便抽样、判断抽样、自愿样本、滚雪球抽样、配额抽样等方式。
24、方便抽样:调查过程中由调查员依据方便的原则,自行确定入抽样本的单位。
25、判断抽样:研究人员根据经验、判断和对研究对象的了解,有目的选择一些单位作为样本。
26、自愿样本:被调查者自愿参加,成为样本中的一分子,向调查人员提供有关信息。
27、滚雪球抽样:先选择一组调查单位,对其实施调查之后,再请他们提供另外一些属于研究总体的调查对象,调查人员根据所提供的线索,进行此后的调查。
这个过程持续下去,就会形成滚雪球效应。
28、配额抽样:先将体中的所有单位按一定的标志(变量)分为若干类,然后在每个类中采用方便抽样或判断抽样的方式选取样本单位。