统计学及其基本概念
谁做?
统计局系统、 企业信息化
统计资料 Statistical data
统计资料是统计工作过程中 所取得的各项数字资料以及与之 相关信息的总称。统计资料是统 计工作取得的能够说明所研究对 象的数据。例如国内生产总值数 据,说明整个国家的生产规模。 这些数据经常会在报纸、杂志上 出现。
统计学
Statistics
统计学是在统计工作的经验积 累到一定程度时自然产生的,它是 收集、整理、描述分析统计数据的 方法和技术,为我们的决策提供 “量”方面的依据。
《不列颠百科全书》对统计学的定 义为:“统计学是关于收集和分析数据 的科学和艺术”。
中华人民共和国国家统计局
企业信息化模式
艺术:金字塔
描述统计学
Descriptive Statistics
确定性变量
certainty variables
受确定性因素影响的变量称 为确定性变量。这种影响变量值 变化的因素是明显的,是可以解 释的,是人为的或者受人控制的, 其影响变量值的大小、方向都可 以确定。
随机变量
random variable
受随机性因素影响的变量称 为随机变量,所谓随机因素,是 指各种不确定的、偶然性的因素, 这种因素对变量影响的大小和方 向都是不确定的,通常是微小的。
标志按其性质分为品质标志和数量标志。
标志按变异情况分为不变标志和可变标志。 可变的数量标志称为变量,其值称为变量值。
指标
统计指标,简称指标(indicator),是反映总 体数量特征的,由各个个体的标志值汇总综 合而成。任何一个统计指标都是经过了从个 别到一般、从具体到抽象的过程,它体现总 体特征,具有综合性。 注意:口径 - 外延、维度
案例1 案例2 案例3 案例4
认识数据
四个数据集:
中国主要宏观经济指标数据集、95世界各国基本情况数据集
公司人力资源部数据集 、企业流水线上的抽样数据集
按测量的精度分:分类数据
顺序数据 数值型数据 截面数据 面板数据
按与时间的关系分 :时间序列数据
按数据表现形式分:绝对数
相对数 平均数
连续型变量 随机变量
分类: 离散型变量、连续型变量
确定性变量、随机变量
离散型变量
discrete variable
离散型变量一般用“点数” 的方法取得,数值往往是整数, 如职工人数、企业个数、设备台 数等。
连续型变量
continuous variable
连续型变量用“测量”取得, 测量的仪器越精密,变量值就会 越精确,如人的身高、体重;产 品的长度、重量等。
案例2
2005年3月16日上证平均指数中30支股
票的市盈率是21.08。东方电子集团有限公
司的市盈率是17.92。这时,市盈率方面的
统计信息显示:与上证指数股票的平均收入
相比,东方电子集团有限公司的股票价格较 低。因此,投资顾问可以得出结论:东方电 子集团有限公司的现行价格低估了。
案例3
假设一家会计师事务所想确定客户的资 产负债表中所显示的应收账款的数量是否公 正地体现了实际的应收账款的数量。通常, 应收账款的账目数量很大,要审查和验证每 个账户既费时又费钱。 怎么办? 抽样调查可以解决问题!
计算工具
计算器-要求会用“统计功能” 计算机-要求会用“Excel”作分析
1. 公式和函数
2. 数据分析工具
总体
统计总体,简称总体(Population), 就是统计所要研究的事物或现象的全体, 即由客观存在的,具有某种共同特征的 许多个别事物构成的整体。 总体的特点:大量性、同质性、 差异性、相对性
人物:
【英国】威廉· 配第和约翰· 格朗特
贡献:
开用数量方法研究社会经济现象之先河
评价: “有统计之实,无统计之名”的学派
威廉· 配第
配第著作《政治算 术》中,对当时的英国、 荷兰、法国之间的财富 进行数量上的计算和比 较。 马克思称配第是 “政治经济学之父,在 某种程度上也可以说是 “统计学的创始人”
数量指标
它是反映客观事物的规模或水平的指标, 它表现为汇总后直接得到的绝对数或总量, 又称之为总量指标或绝对指标。数量指标是 最基本的指标,它是计算其他指标的基础。 数量指标包括标志总量和总体单位总量,如 总产值、工资总额、人口总数、企业个数等。
质量指标
它是反映客观现象之间的相互联系、比 例关系、发展速度、内部结构的指标,一般 用相对数或平均数表示。如劳动生产率、成 本利润率、人均国民收入等。质量指标是由 两个数量指标对比求得的,它是由数量指标 派生的。
数理统计学派
人物:
【比利时】人才济济。如:凯特勒、戈赛 特 、费希尔、内曼、卡尔 皮尔逊 贡献:
(1)完成统计学和概率论结合
(2)建立了丰富的数理统计理论
凯特勒
比利时统计学家(1796-1874)
著作《社会物理学》提出著名的 “平均人”概念,认为:社会所有 的人与“平均人”的差距越小,则 社会矛盾就越缓和。
描述统计学研究如何取得反 映客观现象的数据,并通过图表 形式对所收集的数据进行加工处 理和显示,进而通过综合、概括 与分析得出反映客观现象的规律 性数量特征。
推断统计学
Inferential Statistics
推断统计学是研究如何根据 样本数据去推断总体数量特征的 方法,它是在对样本数据进行描 述的基础上,对统计总体的未知 数量特征作出以概率形式表述的 推断。
个体
个体(Item Unit)是构成统 计总体的个别事物,又称为总体 单位。
样本
样本(Sample)是指从统计总 体中抽取出来作为代表这一总体的、 由部分个体组成的集合体。
抽ቤተ መጻሕፍቲ ባይዱ原则:随机、非随机
非随机抽样:任意抽样、判断抽样、配额抽样
标志
统计标志,简称标志(characteristic), 是指每个个体所共同具有的属性或特 征,它是说明个体的属性或特征的具 体名称。
企业管理与信息处理指标子体系
工业企业经营管理指标 工业企业企业管理指标
信息获取与利用指标
工业企业财务管理指标
工业企业经济效益评价指标
国民经济核算体系
许多学者把卡尔· 皮尔逊
尊称为“统计学之父”。
社会统计学派
人物: 【德国】克尼斯、恩格尔和梅尔 观点: 统计学的研究对象是社会现象,目 的在于明确社会现象的内在联系和相 互之间的关系。
在研究过程中,要用全面调查,也 可以适量的使用抽样调查。
案例
收集数据 →
整理数据 → 分析数据 → 展现结果 →
统计描述法
统计描述法是对由调查或实 验得到的统计数据资料进行整理、 归类,计算出各种能反映总体数 量特征的综合指标,并加以分析 研究,从而得出需要的数据资料 信息,用表格、图形和统计指标 数值来表示的统计方法。
统计学中的各大著名学派
1. 国势学派 2. 政治算术学派 3. 数理统计学派
4. 社会统计学派
相对数
relative number
相对数是由两个相互联系的 绝对数对比得到,反映事物的相 对数量。常用的相对数包括:结 构相对数、动态相对数、比较相 对数、计划完成相对数。
平均数 average
平均数反映现象总体的一般水平。 如: 职工的平均工资。
变量
变量(variable)总是可以用数值形 式表现的,可变的数量标志和所有 的统计指标都是变量。
数值型数据有两种衡量尺度:
一是定距尺度(interval scale)
二是定比尺度(ratio scale)
区别:“零点”
时间序列数据
time series data
时间序列数据是在不同时 间上收集到的数据,它所描述 的是现象随时间而变化的情况。
截面数据
cross-sectional data
截面数据是在相同或近似 相同的时间点上收集的数据, 它所描述的是现象在某一时刻 或某一时间段的变化情况。
第一章 统计学及其基本概念
本章内容
一、 统计学简介 二、 认识数据
三、 基本概念
四、 统计计算工具
统计学简介
统计的涵义:
统计工作、统计资料、 统计学
案例: 我该什么时候上网?
统计学的内容 :
描述统计学 、推断统计学
统计学的过去与现在:
统计学中的各大著名学派、统计学的现代格局
统计学在经济管理中的应用:
互联网的用户人数及分布、信息流量分布、域名 注册、用户通常在什么时间上网等信息都可以从 电讯局或网络公司的业务记录中获得 。
汇总每天某个时间点上,在线用户占注册用户的 比例来反映用户通常上网的时间
作出决策
早点起,在网上飞驰
案例1
1995年9月,美国斯坦福大学经济学教
授刘遵义就通过实证比较,数量分析和模糊 评价等方法,预测出菲律宾、韩国、泰国、 印尼和马来西亚有可能发生金融危机。
变量按获取方式分:离散型变量 变量按获取方式分:确定性变量
基本概念
总体 、个体、样本、标志、指标、变量
统计计算工具
Excel:
统计函数、统计分析工具 马克威统计分析软件
(方差分析、多元统计分析等) 附:认证考试说明
统计工作
Statistical work
统计工作是为了管理或认识 的需要,对社会经济现象和自然 现象进行数量收集的活动。
顺序数据
rank data
即等级数据,是对事物进行 分类的结果,这些分类在语义上 表现出明显的等级或顺序关系, 例如,学生成绩可以分为优秀、 良好、中等、及格和不及格。
顺序数据以定序尺度(ordinal scale)来衡量。
数值型数据 metric data
数值 型数 据是 使用 自然 或 度量衡单位对事物进行测量的结 果,其结果表现为具体数值。