当前位置:文档之家› 江苏省自学考试-社会统计学-复习提纲word版本

江苏省自学考试-社会统计学-复习提纲word版本

第一章导论第一节社会统计的产生与发展国势学派产生于德国,创始人为康令和阿享瓦尔,又可称为记述学派和历史学派。

政治算数学派创始人是英国人格朗特和威廉.配第数理统计学派比利时统计学家凯特勒首先将概率论原理引入到社会现象的研究中,被称为“现代统计学之父”。

战后社会统计工作发生的一系列变化:经济与社会发展计划(法国)该计划规定,要关心经济增长成果的分配和区域发展。

社会指标运动(美国)用社会指标的方法解决社会分析和社会规划的基本理论。

国民经济与社会发展计划(中国)第二节社会统计的对象与特点社会统计学运用统计学的一般原理,对社会各种静态结构与动态趋势进行定量描述或推断的一种专门方法与技术。

广义的社会统计学在我国实际上就是社会经济统计学狭义的社会统计学从社会经济统计学中独立出来的社会统计学第三节社会统计的方法描述统计讨论范围仅以搜集资料本身为限,而不予以扩大。

推论统计主要是依据概率论,研究如何依据有限资料对总体性质作推断,从而使统计的功能大为扩充。

大量观察法就总体中足够多的单位进行调查并综合分析,用以反映社会总体的数量特征。

大数规律随机现象出现的基本规律,它的一般意义是:观察过程中每次取得的结果不同(因为具有偶然性),但大量重复观察结果的平均值却几乎接近某个确定的数值。

第四节社会统计的几个基本概念总体作为统计的研究对象的、由许多具有共性的单位构成的整体总体单位构成总体的每一个个体被称为总体单位。

总体的基本特征大量性、同质性和变异性。

有限总体和无限总体总体按其包括的单位的数目是有限还是无限,分为有限总体和无限总体。

样本通过抽样得到的用以推断总体特征的那个“部分”。

现实总体一些看得见摸得着的个体构成想象总体想象总体都是无限总体。

标志说明总体单位属性或数量特征的名称在统计上称为标志。

变量可变的数量标志能够用数值表示,称之为变量。

连续变量相邻的两个变量值之间可以连续不断分割的变量。

离散变量各变量值之间是以整数断开的变量。

自变量作为变化依据的变量。

依变量随自变量而发生对应变化的变量。

随机变量在相同的条件下进行观测,其可能实现的值不止一个确定性变量条件一定,可能实现的值确定。

统计指标反映总体的数量特征的概念或范畴。

社会指标体系一系列有内在联系的社会统计指标的集合体。

质量指标说明总体在内涵上的数量特征。

数量指标说明总体在外延上的数量特征。

社会统计指标体系建立对社会统计学所具有的意义全面衡量社会发展情况。

第五节社会统计工作的程序制定计划统计调查按照统计研究所预定的目的和任务,运用各种调查的组织形式,有组织、有计划地向调查对象搜集原始资料的工作过程。

统计整理根据统计研究的目的和任务,对调查所得的资料进行加工整理,使之条理化、系统化。

统计分析统计报告将所得结果用文字报告的形式表达出来,以供有关方面参考和利用。

第二章社会统计资料的搜集第一节统计调查的方法及种类原始资料指由调查者直接搜集的、未经加工整理而保持其原本状态的资料。

次级资料指经他人加工整理,可以在一定程度上被引用来说明总体特征的资料。

一般调查和专项调查(从调查目的上分)一般调查是为了取得用于多种目的的统计数据;专项调查是为了取得用于研究、分析某些专门问题的统计资料。

全面调查和非全面调查(从调查范围上分)全面调查对构成调查对象的总体中的所有个体进行调查登记,无一遗漏;非全面调查只对构成调查对象的总体中的部分单位进行调查登记。

经常性调查和一次性调查(按调查等级的时间是否连续)经常性调查即连续调查,是对调查对象的变化进行连续不断地登记;一次性调查即不连续调查,是隔一段较长时间进行的调查,但不是指调查只进行一次。

社会统计资料搜集的具体方法问询法调查者运用访谈、问卷、电话、通讯等方式,直接或间接向被调查者询问,并根据被调查者的答复取得资料的一种调查方法。

观察法在现场对调查对象的情况直接观察、记录的一种调查方法。

报告法以各种原始记录为依据,由被调查者或单位按照有关规定和隶属关系,逐级向上提供统计资料的一种方法。

实验法根据一定的研究目的,选择一组研究对象,认为得改变与控制某些因素,然后观察其后果的一种方法。

文献法通过记录社会现象的各种载体,从中获取所需信息的一种方法。

第二节统计调查的组织形式普查即全面调查,就是对研究对象的全体作无一遗漏的逐个调查。

重点调查在研究对象的总体中,选取其中的重点单位进行调查。

典型调查根据调查的目的和要求,在对所研究对象进行初步全面分析的基础上,从中选出有代表性的单位,做周密细致的调查。

抽样调查把研究对象当做总体,从总体中按随机的原则抽出一定数量的研究单位作为样本,直接调查的对象是样本单位,收集的资料是样本资料,然后借助样本指标数值来推算总体指标数。

抽样调查的优点省时、省力和节省经费。

由于抽样调查范围较小,调查工作可能做得更加深入细致,减少发生错误的机会,提高资料的可信程度。

简单随机抽样对总体中所有单位不进行分组只进行编号,然后组成样本,赋予总体中每一单位以相同的被抽中的机会。

分层抽样首先将总体中的所有单位按某种标志顺序排列、编号,而后从随机选择的第一个单位开始,按照相等的间隔抽取样本单位。

成组地抽,并对抽中的群或组的所有单位进行全面调查。

系统抽样将总体单位按某种标志顺序排列、编号,而后从随机选择的第一个单位开始,按照相等的间隔抽取样本单位。

回置抽样从总体中抽取一个单位,登记后又放回总体中去,然后再抽下一个单位。

非随机抽样不严格遵循随机原则的抽样调查。

测量从研究对象中获取资料或数据的一种观察和登记过程。

测量的四个水平定类尺度两个属性:对称性和传递性定序尺度反对称性和传递性,具有方向性定距尺度在这一层次上可以做减法运算,无法做除法运算定比尺度第四节统计误差统计误差在调查和统计过程中所得到的数据或指标,与客观实际数量特征之间存在的差别。

登记性误差指在调查和统计过程中由于各种主观因素而引起的技术性、操作性误差以及由于责任心缘故而造成的误差等。

代表性误差由于样本资料得到的指标和总体指标之间可能存在的差数,它可以反映样本在多大程度上代表总体,所以称为代表性误差。

非抽样误差由于破坏抽样随机原则而产生的系统性、倾向性误差,也称偏差。

抽样误差在遵守速记原则的条件下,用样本指标代表总体指标不可避免存在的误差。

判断一个抽样方案优劣的主要因素主要从抽烟精确度和抽样调查费用两个因素考虑。

最优的抽样设计方案应当是在既定调查费用的范围内达到最高精确度的方案,或者是在既定要求的抽样精确度内所耗费用最少的抽样方案。

在社会研究中统计误差特别要注意的方面防止出现非抽样误差;当被调查的主体是人。

而对所调查的标志又没有完全不依赖调查者的客观测定方法时,则调查方式很重要,否则得不出可靠结果。

第三章社会统计资料的整理第一节统计分组的原则与标准统计分组将情况相同或相近的资料加以分门别类的归并,使之简化明晰,以便为统计分析提炼各种有用信息打下基础。

统计分组的关键选择分组标志和划分各组界限统计分组的原则分组应使个类别构成之和等于总体;分组设计应符合现象次数分配的规律性频数分配列表在统计资料搜集的基础上,按分组原则,将总体中所有单位依一定的顺序归类整理,即可得到能够表明总体中各单位分部情况的频数分配列表。

品质数列按品质标志进行分组变量数列按数量标志进行分组第二节统计表统计表表示统计资料的表格,在由横行、纵栏交叉结合而成的表格上,它能系统地组织和合理地安排大量数字资料。

主词与宾词主词是统计表所要说明的对象。

宾词是用来说明主词的标志和标志值。

统计表格式统计表制作的一般规则标题部分栏目部分线格部分数字部分其他第三节变量数列的编制频数总体单位在各组中出现的次数。

相对频数(频率)将各组频数除以总体单位数单项式变量数列和组距式变量数列单项式变量数列是指数列中每一组的变量值都只有一个;组距式变量数列是指数列中每一组由两个变量值差数的一个数值范围来表示。

开口与闭口有上限而缺下限或有下限而缺上限的组称开口组;上限和下限齐全的组称闭口组。

上限、下限和组距区间距离称为组距;每组的起点数值为下限,其终点数值为上限,上限与下限之差就是组距。

组中值上限与下限之间的中点数值称为组中值。

频率(频数)密度单位组距内分布的频数累计频数分为向上累计和向下累计。

组数、组距和全距的关系组距与组数两者成反比。

第四节统计图直方图用矩形的高度来表示数列各组的频数或频率。

折线图把直方图各矩形顶部的中点用直线连接气力啊,并把原来的矩形抹掉,就得到频数多变形图曲线图对应与连续变量的频数分部的函数关系图。

正态分布钟形曲线对称分部偏态分部非对称分部洛伦兹曲线用来反映社会收入分配平均程度的一种累计百分数曲线。

第四章集中趋势的量度:平均指标平均指标表明同质总体在一定条件下某一数量标志所达到的一般水平。

算数平均数的性质各变量值与算数平均数的离差之和等于0.各变量值对算数平均数的离差的平方和,小于它们对任何其他数偏差的平方和。

算数平均数受抽样变动的影响微小,通常它是总体资料集中趋势的最佳量度。

算数平均数受极端值的影响颇大,遇到这种情况时,就不宜用它代表集中趋势了。

分组资料如遇有开放组距是,不经特殊处理将无法得到算数平均数。

中位数把总体单位某一数量标志的各个数值,按大小顺序排列,位于正中处的变量值。

中位数的性质(1)各变量值对中位数之差的绝对值总和,小于它们对任何其他数之差的绝对值总和。

(2)中位数不受极端值影响(3)分组资料有不确定组距时,仍可求得中位数。

(4)中位数受抽样变动的影响较算数平均数略大,因此中位数作为总体资料集中趋势的量度,使用也很广泛。

四分位数通过三个特定的变量值,可将研究总体中的各单位分割成相等的四部分,这三个分割的变量值就是所谓的四分位数。

众数在一组资料中,出现次数呈现“峰”值的那些变量值。

位置平均数众数和中位数被统称为位置平均数。

几何平均数 N个变量值连乘积的N次方根。

调和平均数 N个变量值倒数算数平均数的倒数,也称倒数平均数。

第五章集中趋势的量度:变异指标变异指标用以反映总体各单位的标志值的变动范围或参差程度,与平均指标相对应,从另一个侧面反映总体的特征。

绝对离势和相对离势变量指标以数量关系来分类可分为两类:凡用绝对数来表示的变异指标称为绝对离势;用相对数来表达的变异指标称为相对离势。

第一节第二节全距与四分位差全距最大变量值与最小变量值之差,用R来表示。

四分位差第三四分位数和第一四分位数的半距,用Q.D表示。

第二节平均差平均差各变量值对其算数平均数离差绝对值的算数平均数。

平均差的性质受抽样变动影响、受极端值影响和处理不确定组距方面性质同于算术平均数。

平均差不适于代数运算。

第三节第四节标准差标准差各变量值对其算术平均数的离差平方的算术平均数的平方根。

方差标准差的平方第五节第六节相对离势异众比率指非众数的频数与总体单位数的比值,用V.R表示。

相关主题