当前位置:文档之家› 数学统计学及其基本概念

数学统计学及其基本概念


总体与个体
统计总体,简称总体(population),就是统计 所要研究的事物或现象的全体,即由客观存 在的,具有某种共同特征的许多个别事物构 成的整体。 个体(Item Unit)是构成统计总体的个别事 物,又称为单位。
总体的特点:
1、大量性
2、同质性 3、差异性 4、相对性
总体容量 有限总体 无限总体
数据挖掘的典型: 啤酒与纸尿裤
一、认识数据
1. 中国历年主要宏观经济指标数据集(数据集01) 2. 1995年世界各国基本情况数据集(数据集02) 3. 公司人力资源部数据集(数据集03) 4. 企业流水线上的抽样数据集(数据集04)
EXCEL
现代汉语词典对数据的解释是:进行各种 统计、计算、科学研究或技术设计等所依 据的数值。我们提供四个数据集,让大家 对数据有一个直观的了解。
平均数
反映现象总体的一般水平。
思考:平均数和相对数的区别
五、变量
最常见的分类是:离散型变量和连续型变量。离散型变
量一般用“点数”的方法取得,数值往往是整数,如职工 人数、企业个数、设备台数等。连续型变量用“测量”取 得,如人的身高、体重;产品的长度、重量等。 变量还可分为确定性变量和随机变量。受确定性因素 影响的变量称为确定性变量。受随机性因素影响的变量称 为随机变量,所谓随机因素,是指各种不确定的、偶然性 的因素,这种因素对变量影响的大小和方向都是不确定的, 通常是微小的。 定性变量和定量变量
贡献:
(1)完成统计学和概率论结合
(2)建立了丰富的数理统计理论
社会统计学派 人物: 【德国】克尼斯、恩格尔和梅尔
观点:
统计学的研究对象是社会现象,目的在于明确社 会现象的内在联系和相互之间的关系。 在研究过程中,要用全面调查,也可以适量的使 用抽样调查。
恩格尔系数
(二)统计学的现代格局
以社会经济问题为主要研究对象的社会经济统计
(一)口径一致是统计指标的基本要求
1. 统计指标是反映研究对象总体特征的,确定研究 对象往往与一定的理论相联系,理论定义的范畴应该 和实际获得的指标数值的口径统一。 2. 统计口径包括两个方面:一是计算口径外延的明
一、统计总体和个体 二、总体的特点 三、样本
一、统计标志 二、统计指标 三、统计指标体系
一、统计分析软件简介 二、Excel实现数据处理的主要途径
一、统计的涵义
1. 统计工作(statistical work) 2. 统计资料(statistics, statistical data) 3. 统计学(statistics)
数据集1
中国历年主要宏观经济指标数据集
数据集2
1995年世界各国基本情况数据集
数据集3
公司人力资源部数据集
数据集4
工厂流水线上的抽样数据集
数据类型Ⅰ
1. 分类数据(categorical data) 2. 顺序数据(rank data) 3. 数值型数据(metric data)
定性数据
品质数据
Hale Waihona Puke 存在形式:纸质,电子版,网站数据库
部分网上数据资源
中国国家统计局: 上海统计局: 信息产业部:/mii/hyzw 国家外汇管理局: 国信证券: 中国人民银行网: 经济杂志网: 北京大学网:/dataset/yearbook 中国疾病预防控制中心: /feiyan/default1.asp 国际货币基金组织数据库: 经合组织数据库: 美国: 美国人口普查局: 美国会图书馆:/ 美国商业部:/ 亚洲东盟网站: APEC 网站:.sg 美国 IBM 公司:/investor 美国: 美国纳斯达克网: 荷兰国家统计局: http://www.cbs.nl/en-GB/default.htm 美国统计协会商业与经济统计部
按研究方法
描述统计学 推断统计学
描述统计学
Descriptive Statistics
描述统计学研究如何取得反 映客观现象的数据,并通过图表 形式对所收集的数据进行加工处 理和显示,进而通过综合、概括 与分析得出反映客观现象的规律 性数量特征。
推断统计学
Inferential Statistics
以方法和应用研究为主的数理统计
学科的角度,前者从属于应用经济学;后者从属于数学
对计算机的依赖越来越
统计学从有关领域中吸取的养分也越来越多 交叉发展的趋势越来越强
三、统计学在经济管理中的应用
统计给我们智慧与力量 统计学在经济领域的应用 (案例1 案例2)
统计学在管理领域的应用 (案例1 案例2)
案例1
标志值
分类:品质标志和数量标志
不变标志和可变标志
是非标志
指标
统计指标,简称指标(indicator),是反映总体数 量特征的,由各个个体的标志值汇总综合而成。任 何一个统计指标都是经过了从个别到一般、从具体
到抽象的过程,它体现总体特征,具有综合性。
(一)口径一致是统计指标的基本要求 (二)统计指标按反映问题的数量特征分类 (三)统计指标按核算的范围分类
分类数据(categorical data) 分类数据是对事物进行分类的结果,数据的
主要特征是采用文字、数字的代码和其他符号
对事物进行简单的分类和分组。
分类数据以定类尺度(nominal scale)来衡量。
顺序数据(rank data)
即:等级数据
也是对事物进行分类的结果,只是这些分类 在语义上表现出明显的等级或顺序关系; 例如,学生的成绩; 对商品和服务的满意程度 顺序数据以定序尺度( ordinal scale )来衡量。
第一章 统计学及基本概念
南京财经大学统计学系
本章内容
第一节 统计学简介
一、统计的涵义 二、统计的过去与现在 三、统计学在经济管理中的应用
第二节
数据及其分类
一、认识数据 二、数据类型Ⅰ 三、数据类型Ⅱ 四、数据类型III 五、数据类型IV
第三节
第四节 第五节
总体、个体与样本
标志、指标与指标体系 统计计算工具
3. 统计学(statistics) 统计学是在统计工作的经验积累到一定程 度时自然产生的,它是收集、整理、描述 分析统计数据的方法和技术,为我们的决 策提供“量”方面的依据。
《不列颠百科全书》对统计学的定义为: “统计学是关于收集和分析数据的科学和 艺术”。
统计学的分类
按研究内容:
理论统计学 应用统计学
数值型数据
定量数据或数量数据
数值型数据是使用自然或度量 衡单位对事物进行测量的结果,其 结果表现为具体数值。
两种衡量尺度: 定距尺度(interval scale) — 温度 定比尺度(ratio scale) 区别:“绝对零点”
数据类型Ⅱ
截面数据(cross-sectional data) 时间序列数据(time series data) 面板数据(panel data)
提出世界公认的名词-统计学(Statistics)
评价:
“有统计之名,无统计之实”的学派
政治算术学派 人物:
【英国】威廉· 配第和约翰· 格朗特
贡献: 开用数量方法研究社会经济现象之先河 评价: “有统计之实,无统计之名”的学派
数理统计学派
人物:
【比利时】人才济济。如:凯特勒、戈赛 特 、费希尔、内曼、卡尔.皮尔逊
样本
样本(Sample)是指从统计总体中抽取出 来作为代表这一总体的、由部分个体组成的 集合体。
代表性 样本量(sample size)
抽取原则:随机、非随机
非随机抽样:
判断抽样、配额抽样、滚雪球抽样 …
总体、样本和个体间的关系
标志
统计标志,简称标志,是指每个个体所共同具有的 属性或特征,它是说明个体的属性或特征的具体 名称。
面板数据
是对若干个单位在不同时间进行 重复跟踪调查所形成的数据。
例如,我们连续20年收集得到的 企业工人的工资、受教育程度和 就业情况的数据。
数据类型III
绝对数(absolute number)
相对数(relative number)
平均数(average)
绝对数
是统计数据的基本表现形式,是其他指标形式形 成的基础。现象的总体规模和水平一般都以绝对数 形式表现,如:总人口、国内生产总值、货物周转 量等都是绝对数;其计量单位有实物单位、价值单 位和复合单位三种。 分为:时期数和时点数。 时期数是反映现象在一段时期内的总量。如产品 产量、产值、销售额等。特点:可以连续计数,并 可以累积。 时点数是反映现象在某一瞬间时刻上的总量,如 人口数、商品的库存量、银行储蓄余额等。 特点:只能间断计数,各时点不能累积。
主要做三件事: 收集数据 整理数据 分析数据
1. 统计工作(statistical work)
统计工作是为了管理或认识的需要,对社会经济现象和自 然现象进行数据收集的活动。
统计局系统
企业信息化
2. 统计资料(statistical data)
统计资料是统计工作过程中所取得的各项数字资料以 及与之相关信息的总称。统计资料是统计工作取得的 能够说明所研究对象的数据。例如国内生产总值数据, 说明整个国家的生产规模。这些数据经常会在报纸、 杂志上出现。
汇总每天某个时间点上,在线用户占注册用户的 比例来反映用户通常上网的时间
作出决策 →
早点起床,在网上飞驰
二、统计的过去与现在
(一)统计学中的各大著名学派 1.国势学派 2. 政治算术学派
3.数理统计学派 4. 社会统计学派
(二)统计学的现代格局
国势学派 人物: 【德国】康令和阿亨瓦尔 贡献:
结论:东方电子集团有限公司的现行价格低估了。
案例1
一家会计师事务所想确定客户的资产负债表中所显示的应收账 款的数量是否公正地体现了实际的应收账款的数量。通常,应 收账款的账目数量很大,要审查和验证每个账户既费时又费钱。
相关主题