第二章 统计学的基本问题
工业企业财务管理指标 工业企业经济效益评价指标
国民经济核算体系
标志按其性质分为品质标志和数量标志。 标志按变异情况分为不变标志和可变标志。 可变的数量标志称为变量,其值称为变量值。
品质标志:
表明个体属性方面的特征,品质标志的标志只 能用文字说明,不能用数量表示。即得到分类数据 和顺序数据。如家庭住址、性别等。
数量标志
是表明个体数量特征的,其标志表现只能用数 字体现,即得到数值型数据。如身高、血压等
分类: 离散型变量、连续型变量 确定性变量、随机变量
离散型变量一般用“点数”的方法取得,数值 往往是整数。如职工人数、企业个数、设备台 数等。
连续型变量用“测量”取得,测量的仪器越精 密,变量值就会越精确。如人的身高、体重; 产品的长度、重量等。
受确定性因素因素影响的变量称为确定性变量。 如总产品成本的变化 受随机性因素影响的变量成为随机变量。 如流水线上生产的零件的尺寸。
举例
1、2005年我国各地区的人口数 2、2006年我国各地区的国内生产总值 这些数据都属于截面数据。
总体
统计总体,简称总体Population), 就是统计所要研究的事物或现象的全体, 即由客观存在的,具有某种共同特征的 许多个别事物构成的整体。 总体的特点:大量性、同质性、
差异性、相对性
个体
指标
统计指标,简称指标(indicator),是反映总 体数量特征的,由各个个体的标志值汇总综 合而成。任何一个统计指标都是经过了从个 别到一般、从具体到抽象的过程,它体现总 体特征,具有综合性。
注意:口径 - 外延、维度
分类: 数量指标、质量指标
总体指标、样本指标
变量
变量(variable)总是可以用数值形 式表现的,可变的数量标志和所有 的统计指标都是变量。
数据按是否与时间有关分 :
时间序列数据(time series data)、截面数据(cross-sectional data)
中国历年主要宏观经济指标数据集(数据集01)
1995年世界各国基本情况数据集(数据集02)
公司人力资源部数据集(数据集03)
企业流水线上的抽样数据集(数据集04)
基本概念
1. 公式和函数 2. 数据分析工具
分类数据
分类数据是对事物进行分类 的结果,数据的主要特征是采用 文字、数字的代码和其他符号对 事物进行简单的分类和分组。
分类数据以定类尺度(nominal scale)来衡量。
举例
1、人口按性别、民族、行政区划和婚姻状况做归 类统计
2、企业按照经济性质进行分类
顺序数据以定序尺度(ordinal scale)来衡量。
举例
1、学生成绩可以分为优秀、良好、中等、及格和 不及格。
2、产品质量可以分为优等品、合格品和不合格品。
3、用户的满意程度可以分为很满意、满意、不满 意和很不满意。
由于分类数据和顺序数据都说明的是事物的品 质特征,通常用文字来表述,其结果均表现为类别, 因此也把他们统称为定性数据或品质数据。
总体 、个体、样本、标志、指标、变量
指标体系
一系列相互联系、相互制约的多个统计 指标就构成统计指标体系。
举例1:工业企业统计指标体系 ~企业管理与信息处理指标子体系
举例2:宏观统计指标体系 ~国民经济核算体系
计算工具
一、统计分析软件 SAS/ SPSS/ Statistica/ MiniTab 二、EXCEL数据处理 计算器-要求会用“统计功能” 计算机-要求会用“Excel”作分析
二、本次旅游你对旅行社的服务感到 ________。 1. 很满意 2. 满意 3. 不满意 4.很不满意 三、你所到的地方当天最高气温是:_______。 四、本次旅游你总的花费是: _______。
问:这张调查表中包含了数据的所有类型有哪 几种?
时间序列数据
时间序列数据(time series data ) 是 在 不 同 时 间 上 收 集 到 的数据,它所描述的是现象随 时间而变化的情况。
数值型数据
数值型数据是使用自然或 度量衡单位对事物进行测量的结 果,其结果表现为具体数值。
例如:学生的考试成绩
人的年龄
产品的产量等
数值型数据有两种衡量尺度: 一是定距尺度(interval scale) 二是定比尺度(ratio scale) 举例说明
我们从一个例子来认识数据。南京是一个著名 的“火炉”城市,为避夏季的酷热,金陵旅行社推 出了“南京周边一日游”,有许多市民参加了,旅 游结束后,他们被要求填下面的一张调查表: 一、本次旅游你去了什么地方? 1. 西递、宏村 2. 天堂寨 3. 西塘 4. 九寨沟
106.5 107.3 118.8
118 103.1 103.4 106.4 114.7 124.1 117.1 108.3 102.8
99.2 98.6 100.4
截面数据
截 面 数 据 ( cross-sectional data)是在相同或近似相同的 时间点上收集的数据,它所描 述的是现象在某一时刻或某一 时间段的变化情况。
质量指标
它是反映客观现象之间的相互联系、比 例关系、发展速度、内部结构的指标,一般 用相对数或平均数表示。如劳动生产率、成 本利润率、人均国民收入等。质量指标是由 两个数量指标对比求得的,它是由数量指标 派生的。
企业管理与信息处理指标子体系
工业企业经营管理指标 工业企业企业管理指标 信息获取与利用指标
为了便于计算机识别和信息传输,对于分类性 质的数据,人们往往给一个类别赋予数字代码。
例如,男性用1表示,女性用0表示,数字代码 不可以直接进行数字的运算。就好像给商品贴上标 签一样,仅仅是示意性的。
顺序数据
即:等级数据
是对事物进行分类的结果, 只是这些分类在语义上表现出明 显的等级或顺序关系,例如,学 生的成绩可以分为优秀、良好、 中等、及格和不及格。
第二章 统计学的基本问题
本章内容
一、 认识数据 二、 基本概念
+=
三、 指标体系 数据集、95世界各国基本情况数据集 公司人力资源部数据集 、企业流水线上的抽样数据集
数据按测量的精度分:
分类数据(categorical data)、顺序数据(rank data) 数值型数据(metric data)-定距尺度、定比尺度
个体(Item Unit)是构成统计 总体的个别事物,又称为总体单 位。
样本
样本(Sample)是指从统计总体 中抽取出来作为代表这一总体的、 由部分个体组成的集合体。
在实际工作中,统计总体称为全及总体,由 于样本是从总体中抽取出来并代表总体的,全及 总体又称为母体,样本则称为子体。
标志
统计标志,简称标志(characteristic), 是指每个个体所共同具有的属性或特 征,它是说明个体的属性或特征的具 体名称。
举例
年份
人均GDP 人口自然增值率
能源生产总量
居民消费价格指数
1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000
956 1103 1355 1512 1634 1879 2287 2939 3923 4854 5576 6054 6307 6547 7078
维度
【例】根据大量资料统计结果,汽车的车祸 有70%发生于中速行驶时,30%发生于高速 行驶时,就此能否认为高速行驶比中速行驶 更安全?
数量指标
它是反映客观事物的规模或水平的指标, 它表现为汇总后直接得到的绝对数或总量, 又称之为总量指标或绝对指标。数量指标是 最基本的指标,它是计算其他指标的基础。 数量指标包括标志总量和总体单位总量,如 总产值、工资总额、人口总数、企业个数等。
15.57 16.61 15.73 15.04 14.39 12.98
11.6 11.45 11.21 10.55 10.42 10.06
9.53 8.77 8.24
80850 86632 92997 96934 98703 104844 107256 111059 118729 129034 132616 132410 124250 109126 100900