统计学原理复习要点程新杰第一章概述第一节统计的含义和特点一.统计的三个基本含义:统计工作.统计资料.统计学二.统计学的三个发展阶段:古典统计学.近代统计学.现代统计学三..社会经济统计学的研究对象:大量社会经济现象的数量方面.四.统计工作的几个阶段:统计设计.统计调查.统计整理.统计分析.统计数据的提拱和管理.五..统计研究的基本方法: .(1)大量观查法.(2)统计分组法..(3)综合指标法..(5)统计模型法. (5)统计推断法六.统计方法的特点:(1) .从定性认识到定性认识(2) .从个体认识到总体认识.(3)从已知量的认识到未知量的推断七.统计的职能:信息职能、咨询职能、监督职能。
第二节:统计的基本概念一.统计总体和总体单位1.统计总体:就是我们所要研究对象的全体.它是由许多个性质相同的总体单位所组成.如:(它可以是全部的职工.所有的学生.所有的设备.所有生产的产品.全市的企业.所有的交通事故等等)2.总体单位:构成总体的个体.(把所有的总体单位的组合在一些就行成了一个总体.)★应明确.总体和总体单位不是固定的.它是随着我们所研究的目的.范围不同.是可以转化的.(原来的总体单位可以变成总体.原来的总位单位可以变给总体)3.总体的特点:同质性.大量性.差异性.二.标志.变量和指标:1.标志:是说明总体单位的属性和特征的名称:(1)品质标志.品质标志说明总体单位的属性特征,无法量化(其标志表现只能用文说明,如职工的性别、文化程度,企业的经济成份,产品品牌等)。
(2)数量标志:说明总体单位的数量特征,能够量化,(如职工的工龄、工资水平,企业的职工数、总产值、总产量、劳动生产率等。
)2.标志表现:即标志特征在各单位的具体表现。
如果说标志是统计所要调查的项目,那么标志表现是调查所得结果,标志的实际体现。
☆标志表现有品质标志表现和数量标志表现之分。
品质标志表现只能用文字表述,因此不能转化为统计指标,但对其对应的单位进行总计时就形成统计指标。
数量标志表现是一具体数值,也称标志值(或变量值。
)☆就一个品质标志或数量标志而言,其具体表现可能多种多样,不能将标志与标志表现混为一谈。
如对三个工人的月工资计算平均数,只能说是对三个标志表现或三个标志值(变量值)计算平均数,不能说对三个数量标志计算平均数,因为数量标志只有一个,即工人“月工资”。
3.标志值:数量标志的表现就叫标志值.(如人的身高这个数量标志.每个人的身高是不同的.有 1.7米.1.62米.在这里身高是标志.,而1.7米.1.65米就叫标志值)★总体单位的关系: 总体单位是统计标志的直接承担者,是载体;统计标志依附于总体单位并说明总体单位的属性和特征。
依附于某个总体单位的标志可以有多个。
4.变量和变量值:(1)变量:可变的数量标志和指标都叫变量.(2)变量值:数量标志的表现.及指标的具体数值都叫变量值..如某学生考的各科平均分65分.在这里平均分是数量标志,.而65分则是变量值.或标志值..又比如.把全市工业企业作为一个总体,全市平均每个工业企业的总产值350万元,在这里平均每个工业企业总产值是变量.而350万元则是变量值或指标值)(3)变量的分类:有连续变量和离散变量.能用小数计量的变量是连续变量,(如企业的产值,人的体重.土地面积等);只能用整数表现的是离散变量,如职工人数.电视机的产量.)5.统计指标:指标是说明总体的综合数量特征的.1.正确理解统计指标时应注意:①统计指标反映现象总体的数量特征;②一个完整的统计指标应该由总体范围、时间、地点、指标数值和数值单位等内容构成。
2. 统计指标和统计标志主要区别是:①指标是说明总体特征的,标志是说明总体单位特征的;②指标具有可量性,无论是数量指标还是质量指标,都能用数值表示,而标志不一定。
数量标志具有可量性,品质标志不具有可量性。
3.标志和指标的主要联系表现在:①指标值往往由数量标志值汇总而来;②在一定条件下,数量标志和指标存在着变换关系。
4.按指标的性质分:数量指标和质量指标.(1).数量指标.是最基本的指标,是计算质量指标的基础.指标数值的大小是随着总体的范围大小而变化.是表明总体的广度.是外延指标.均有计量单位.★数量指标可分:为标志值总量(变量值总量)和总体单位总量(总体单位数或频率总体)标志值总量是由各单位的标志标汇总而来的.总体单位总量就是一个总体内部个体的总数.★数量指标按时间状态可分:时期指标(流量)和时点指标(存量).(2) 质量指标:是反映现象总体相对水平或工作质量的统计指标,又分为:相对指标和平均指标,分别用相对数和平均数表示,它们通常是由两个总量指标对比派生出来的,反映现象之间内在联系和对比关指标.三.统计数据的理化尺度种类.1定量数据(数量数据):包括(1).测量值数据.用量具测出的数据. (又叫连续数据).可以有小数.如身高.体重.温度等(2).计数值数据.用清点的方法得出的数据.只能用整数表示.(如学生人数.产品台数.)2.定性数据(品质数据)包括(1).排序数据.只能用文字说明,不能用数字说明.但能排出现象的顺序.有优劣.好坏之分(如产品的等级。
)(2).分类数据.只是对现象的一种分类.不能排出现象的顺序.没有优劣.好坏之分.( 如民族.职业等)第二章.统计调查和统计整理第一节,统计调查一.统计调查的基本要求:准确性和及时性,是衡量统计工作质量的重要标志二.统计调查的分类.1.按调查的组织形式:统计报表和专门调查.(1) 统计报表由有关部门按照统一的要是要求.自上而下的布置.自下而上的逐级上报的一种调查方式(2).专门调查:是为某一要求而专门组织的调查.包括:普查.重点调查.典型调查.抽样调查2.按调查单位是否全面可分为:全面调查和非全面调查.(1)全面调查:所有单位都调查到了,如普查就是一种全面调查.在全面调查中,总体单位和调查单位是一致的.(2)非全面调查:在全部是总体中只选出一部分单位调查.如抽样调查.重点调查.典型调查,3.按调查是不连续分为:(1)经常性(连续性) 调查(2)一次性(非连续性)调查..对时期现象的调查一般是经常性调查;对时点现象的调查一般是一次性调查(如普查)二.几种专门调查方式.(1)普查.是一种专门的.全面的.反映一定时点状态的一次性的调查方式.★在普查中要特别统一规定调查的标准时点.(如在某次人口普查中规定2000年7月1日零点为标准时点)(2)重点调查:在全部的总体中只选择一部分重点单位进行调查.★重点单位;这些单位的标志值总量之和占总体标志总量的绝大比重.(点单位不是人为的,是客观存在的,只有这个单位的产量高才能成为重点单位.)(3)抽样调查.是一种专门组织的非全面调查.(对产品质量.居民家庭生活水平的调查一般用抽样调查)抽样调查的特点.:(1)随机原则(2)从数量上推断总体.(用样本数指标推断总体指标)其它的非全面调查一般是不能推算总体的.(4)典型调查:是一种专门的.非全面的调查.★判断的依据:是人们有意识的选择调单位.对事物进深入细致的调查.来发现事物的规律是为了总结经验:三.统计调查中数据采集的方法有:直接观查法.报告法.访问法.文献法.问卷法.四.统计调查方案有哪些内容:1.确定调查目的.2.确定调查对象和调查单位.☆调查对象. 调查对象即统计总体,是根据调查目的所确定的研究事物的全体。
统计总体这一概念在统计调查阶段称调查对象。
☆调查单位,构成调查对象的一个个具体单位.即总体单位.☆报告单位(填报单位) 它是提交调查资料的单位,一般是基层企事业组织。
报告单位也称填报单位. 调查单位是调查资料的直接承担者,报告单位是调查资料的提交者,二者有时一致,有时不一致。
如工业企业生产经营情况调查,每一工业企业既是调查单位,又是报告单位;工业企业职工收入状况调查,每一职工是调查单位,每一工业企业是报告单位☆调查项目:调查项目即依附于调查单位(总体单位)的统计标志.3.确定调查提纲和调查表.调查表分(1)单一表(卡片表) :在一张表上只有一个调查单位.其特点是:可以有较多的调查项目.便于整理分类.(2)一览表. 在一张表上可以容纳多个调查单位.其特点是,调查单位不多时用.较单一表节省人力,物力和时间.4.确定调查时间和调查期限☆调查时间:是调查资料所属的时间. 如果调查的是时期现象,调查时间是资料所反映的起讫时间如果调查的是时点现象,调查时间是统一规定的标准时点。
☆调查时限:是进行调查工作的期限,包括搜集资料和报送资料的整个工作所需要的时间。
例如:某管理局要求所属企业在1996年1月底上报95年工业总产值资料,则调查时间是一年,调查时限是一个月;又如.某管理局要求所属企业在96年1月10日上报95年产成品库存资料,则调查时间是标准时间1995年12月31日,调查期限是10天。
第二节.统计整理.一.统计整理的步骤:1.设计方案2.资料审核.3资料分组.4.统计汇总.5.编制统计表,绘制统计图★设计方案和资料审核是前提; 资料分组是关健; 统计汇总是中心; 统计表, 统计图是结果二.汇总前审核的内容: 审核数据的完整性.时效性.和准确性.统计分组:按选定的标志把总体分成若干总分的科学分类.1.统计分组按分组标志的多少分为简单分组和复合分组。
简单分组是将总体按一个标志进行分组,复合分组是将总体按两个或两个以上的标志重叠起来进行分组。
2..统计分组的原则:相同者合并.不同者分开.(分组后则形成,组内同质,.内间差异)3.统组分组的作用:划分现象的类型.表明现象的内部结构.分析现象间的依存关系.4.统计分组的关健:正确选择分组标志.5.统计分组的方法按品质标志分组:.形成品质数列(2)按数量标志分组: 按数量标志分组的目的并不是单纯确定各组在数量上的差别,而是要通过数量上的变化来区分各组的不同类型和性质.☆在按数量标志分组时,要注意找到从量变到质变的数量界限.。
六.频数分布数列(分配数列):按分组标志确定的组别依次排列,同时更出各组的次数所形成的数列叫分配数列.★频数(次数):分布在各组中的总体单位数.★频率(比重):各组的频数占总频数的比重★常见的频数分布特征(1)钟形分布.其特点是”两头大.中间小”就是中间变量值出现的次数.两头的变量值出现的频数少.很多现象都是呈钟形分布.如人的身高.学习成绩等.★对称的钟形分布就是正态分布.(2)U形分布:两头大.中间小的特点.如人口死亡率的频数布呈U形分布.七.变量数列的构成及种类.1.变量数列的构成:一是变量.二是各组频数或频率2.分配数列的种类:分为.品质列数和变量数列变量列数又可分(1)单项式变量数列: 对离散变量,如果变量值的变动幅度小,就可以一个变量值对应(2)组距数列: 对于离散变量的变量值的个数很多时及连续变量则采用组距数列.组距数列可分为:等距数列和异距数列;开口数列和闭口数列;连续数列(同限分组)和不连续数列(不同限分组).(3)离散变量可以编连续数列.又可以编连续数列.连续变量只能编制连续数列3.在同限分组是,组限上的数据的处理原则是:上限不在组内处理.4.组距=全距/组数5.确定组限的原则;最小组的下限要小于最小变量值.最大组的上限要大于最大变量值.八.统计表的构成和种类.1.统计表从形式上看:由总标题,横行标题,纵栏标题和数字资料四部分./统计表从内容上分.由主词和宾词所组成.2.统计表按作用分:调查表.汇总表(整理表).分析表.按主词是否分组及分组的程度分为:简单表:不做分组的统计表;分组表:只按一个标志分组.复合分组表:按两个或两个以上标志分组形成的统计表.第三章总体变量分布特征的统计描述第一节.统计绝对数1.绝对数(也叫总量指标.数量指标).反映现象总体规模大小的数量.是表明现象大小多少的总量.特点:数值大小随研究的总体的范围大小呈同方向变化.2.种类.(1)按所描述的对象分:变量值总量(标志值总量)和频数总量.(总体单位总量) ★应注意的是:当一个总体一经确定,总体的频数总体就是唯一确定的.而变量值总体则不是唯一确定的,它可以有多少变量值总量.(如.在一个班组内职工的人数是频数总量.而工人的日产量,工人的工资总额等则是变量值总量)★总体单位总量是变量值总量的承担者. (2)按时状态分:时期总量和时点总量★时期总量;是反映现象一段时期内发展变化的过程的总量指标.其特点;(1)可加性.即不同时期内的总量是可以直接相加的.(2)有时间长度.时间的长短与指标数值的大小有直接关系.★时点总量:是反映现象在某一时点上上所处的状态的总量指标.其特点(1)不可相加性, 即不同时点上的数值是不能直接相加.(2)不具是时间长度.即时点总量数据的大小与时间间隔的长短没有直接关系.第二节.平均指标及离散程度指标 一.集中趋势的实质. 找出变量的中心值.即找出集中趋势的代表值.(1).常用的反映集中趋势的代表值有:算术平均数和几何平均数(称数值平均数 中位数和众数. (称位置平均数) 二. 平均指标的特点:(1)把总体各单位标志值的差异抽象化了;(2)平均指标是个代表值,代表总体各单位标志值的一般水平三.算术平均数(1)概念:指同质总体内所有变量值的平均值.它是统计中最常用的一种代表集中趋势的代表值.2.影响算术平均数的两个因素:一是各组变量值的大小,二是各组变量值出现的频数或频率的大小.3.基本公式=)(频数总量总体单位总量变量值总量(1)加权算数平均数)(绝对权数--=----∑∑f fXf X (2)加权算数平均数∑∑*=--ffX X )(相对权数-∑ff★(3)频数和频率都称为权数.权数的实质在于频率(∑ff)的变化.★ 在一个变量数列中. 如果各组的频数都增减几倍.各组的频率仍不变,平均数也就不变. ★各组的变量值增加或减少多少,则平均数将增长或减少多少.3.算术平均数的数学特征:(1)各变量值与算术平均数的离差之和等于零.0)(=-∑--X X(2)各变量值与算术平均数离差的平方之和为最小值.=---∑2)(X X 最小值★在组距数列中,分组后各组的组平均数被抽象化了.只能用组中值来代替组平均数.做这样的变通的假设条件是:各组变量值在组内呈的均匀分布.但在现实中能成完全均匀分布的现象是不可能的.所以说由组距数列算出的的平均数一般是个近似值.4. 调和平均数;)..(权数-==∑--m xf m Xm m X 5.几何平均数:是若干个变量值的连剩积开若干次项数的方根.一般用在动态数列中的计算,在静态数列中,如连续流水线上,各车间的平均合格率的计算则采用几何平均法计算.6.中位数(Me)和众数(Mo):都是以位置来代表集中趋势的代表值.中位数不受极端值大小的影响.7.当数列成正态分布时:平均数=中位数=众数.第三节.离散程度一.离散程度:是反映各变量值的分散程度.反映现象的离中趋势的指标. 1.常见的离散程度的统计指标是有:(1)全距(R) (极差) =最大变量值—最小变量值在组距数列中: 全距=最高组的上限值—最低组的下限值(2)方差(σ2):是各变量值与平均数的离差平方的平均数.(3)标准差(σ):是方差的算术平方根.其计量单位与变量值的计量单位相同.它是离散程度最常用的指标★当两个的平均数水平和计量单位相同时.哪个单位的标准标或方差越小.则该单位的平均数的代表性就越强..(4)离散系数:是离散程度的一个相对指标.当总体的平均数不同或计量单位不同时,只能用离散系数来计算.常见的是标准差系数.%100⨯=-Xσνσ★标准差系数越小,表明平均数的代表性越强.生产的均衡性越好.第四章.抽样技术第一节.抽样枝术概念一.抽样技术的特点.(1)随机原则.(2)用样本数据估计总体数据.(3)是以概率估计的方法对总体进行估计.(4).理论上是以大数定律的中心极限定理为基础.(5)抽样误差是不可消除的.,但是可以事先计算并加以控制. 2.参数:总体的指标统称为参数.如:总体平均数(或成数).总体平均数(或成数)的标准差. ★参数的特点:总体参数就是一个客观存在的一个常数.总体参数是唯一确定的.是未知的3.统计量:样本指标统称为统计量.常见的样本平均数.样本成数.样本平均数的方差,标准差.样本成数的方差.标准差★统计量的特点:(1)统计量是样本变量的函数:可理解为.样本指标是样本的函数. (2):在抽样调查中.由于样本不是唯一确定的,所以统计量也不是唯一确定的,它是一个随机变量.(样本指标随着不同的样本而发生变化.所以样本指标是一个随机变量)4. 抽样平均误差。