当前位置:文档之家› 统计学与SPSS第1章 统计与数据

统计学与SPSS第1章 统计与数据

例1:2005年我国出生人口性别比(男:女)已经 升高到119.92,与正常值106相比有严重的偏离。 例2:中国经济增长的起伏
20


GDP增长率
15 10 5 0
1978
1981
1984
年份 中央财经大学统计学院 17
1987
1990
1993
1996
1999
2002
推断统计

推断统计(Inferential Statistics): 从总体中抽取样本,并利用样本数据来推断 总体特征的统计方法。 总体 (population) :由统计研究所涉及的那 些同质个体(也称单位)所形成的集合。 样本(sample):所研究总体的一部分。
推断统计的例子


例1: 2003年人口变动抽样调查以全国为总体, 在全国抽取了990个县(市、区)、3734个乡(镇、 街道)、6544个调查小区的126万人。根据调查 结果推算,2003年末全国总人口为129227万 人,出生人口为1599万人,死亡人口为825万 人,净增人口为774万人。 例2:一家大公司的会计部门会从所有的发票 中选择一部分来检查公司所有发票的准确性。
离散型变量指的是有限个数值或诸如0,
1,2……之类无限可列值的变量。 如果某一变量可以取某一区间或多个区 间中任意数值,则该变量称为连续型变 量。
中央财经大学统计学院 32
横截面、时间序列和面板数据



横截面数据(Cross-sectional data)是在同一 时点或是大约在同一时点所收集的数据。 例如2008年我国各直辖市的GDP 。 时间序列数据(Time series data)是按时间顺 序取得的一系列数据。 例如我国历年的GDP。 面板数据(Panel Data):对多个事物在不同时 期或时点上进行测量得到的数据 。如1990-2008 年全国各个省份的GDP
国籍: 中国 健康状况: 良好
定类尺度 定序尺度 定距尺度 定比尺度
23
精 确

出生年份: 1980

体重: 134公斤
中央财经大学统计学院
(1)、定类尺度 (Nominal Scale)






也称列名尺度、名义尺度、 分类尺度 例如:性别、民族、职业 数据表现为“类别” 各类之间无等级次序 各类别可以用数字代码表 示 根据定类尺度得到的数据 为分类数据。
中央财经大学统计学院
6
应用案例:通用电气(GE)

“六西格玛” 是当前流行的质量管理思想, 其核心是利用统计方法不断改进产品的质 量。Welch 1995年底在通用电气开始发起 “六西格玛” 项目,这些项目的实施取得 了令人诧异的成功:1997年带来的效益是 3.2亿美元。
中央财经大学统计学院
7
应用案例:抽样调查
总体
中央财经大学统计学院
18
样本
推断统计的主要任务:用统计量估计参数
总体 样本
参数(parameter):描 述总体数量特征的概念 常用希腊字母。例如总 体均值用 表示;总体 方差用 2 表示等。
统计量(statistic):描 述样本数量特征的概念, 常用英文字母表示,如样 本均值用 x 表示,样本 方差用 s 2表示等。




应用统计学涉及大量数据的处理工作,需 要借助统计软件完成。 统计软件的种类很多。本课程要求使用 Excel和SPSS Statistics软件。 由于软件的操作很容易,对统计软件的教 学主要采取视频课件+自学的方式完成。 对统计软件的掌握情况通过课程作业来进 行考核。
中 国 市 场 统 计 年 鉴
中央财经大学统计学院
3
什么是统计学

统计学是一门收集、分析、展示和解释数 据 的 科 学 。 ( the science of collecting, analyzing, presenting, and interpreting data) 是一系列从数据中获取有用信息以帮助决 策的原理和方法。
中央财经大学统计学院 33
3、统计指标的概念



一般有两种理解和两种使用方法: 1、统计指标是指反映现象数量特征的概念。 如年末人口数、商品销售额、劳动生产率 等。 2、统计指标是反映现象数量特征的概念和 具体数值。我国2004年的国内生产总值为 136515亿元 。
中央财经大学统计学院
34
统计指标的 分类(概括)



也称间隔尺度 例如年份、摄氏温度 数据表现为“数值” 可以进行加减运算 “0”是只是尺度上的一个点,不 代表“不存在” 根据定距尺度得到的数据为间距 数据。
中央财经大学统计学院
26
(4)、定比尺度 Ratio Scale


也称比率尺度 例如体重、身高 数据表现为“数值” 可以进行加减、乘除运算 “0”表示“没有”或“不 存在” 根据定比尺度得到的数据 为比率数据。
27
中央财经大学统计学院
定距尺度与定比尺度的区别

定距尺度中“0”表示一个具体数值,不 表示“没有”或“不存在”,定比尺度 中“0”表示“没有”或“不存在” 。
-123.15 ℃ 0℃ 26.85℃
定距尺度
- 273.15℃
定比尺度
0K 150K
中央财经大学统计学院 28
300K
定距尺度与定比尺度的区别(续)
中央财经大学统计学院
20
描述统计与推断统计的关系
概率论与 数理统计 总体数据 样本数据 描述 统计
总体内在的 数量规律性
推断 统计
中央财经大学统计学院
21
2 数据和变量类型
“数据!数据!数据!”他不耐烦地喊
道,“我不能做无米之炊!”
—Sherlock · 福尔摩斯
中央财经大学统计学院
22
数据的计量尺度与类型:例子
中央财经大学统计学院 8
课程的主要内容




数据的搜集 数据的描述统计分析 参数估计和假设检验(回顾) 方差分析 非参数检验 相关与回归分析 时间序列分析 统计指数 多元统计分析方法:主成分与因子 分析、聚类与判别分析、列联分析 与对应分析等
中央财经大学统计学院 9
教学资料
中央财经大学统计学院
30
数据和变量类型:总结
数据的类型
定类数据
定序数据
定距数据
定比数据
定性数据
变量 类型
品质变量
Attribute Categorical
中央财经大学统计学院 31
定量数据 数量变量 Numerical
变量的概念和类型

变量是用来描述现象某种令人感兴趣的特征的 概念。


品质变量是描述个体有关属性特征的变量,本 质上不能用数字来表示。例如性别。 数量变量是描述个体有关数量特征的变量,都 是用数字来表示的。例如人数,年龄等。
中央财经大学统计学院 37
相对数和平均数

相对指标:采用两个有联系的数值进行对比 而得到的比值。也称为相对数,如产业结构
比例、性别比、人口密度等等。 平均指标:也称为平均数,反映现象在某一时 间或空间上的平均数量水平。例如职工的平均 工资,平均考试成绩,等等。

中央财经大学统计学院
38
三、常用统计软件简介
在实际应用中定距尺度与定比尺度差别 微不足道,往往不作区分。 例如在SPSS Statistics软件中,数据的计量尺度被分为3 类: 名义(Nominal) 有序(Ordinal) 度量(Scale )
中央财经大学统计学院 29
四种计量尺度的比较



1、四种尺度所包含的信息量是依次递 增的,级别由低到高。 2、根据较高层次的计量尺度可以获得 较低层次的计量尺度。 3、不同的尺度数据对应这不同数据显 示方法和分析方法。
中央财经大学统计学院
15
二、统计学中的基本概念



描述统计和推断统计 总体和样本 参数和统计量 数据和变量类型 统计指标及其分类
中央财经大学统计学院
16
1、描述统计与推断统计

描述统计( Descriptive Statistics ):用表格、 图形和数字来概括、显示数据特征的统计方法。
中央财经大学统计学院
36
时点数和时期数

时点数 是描述某种现象在某一个特定时刻(某 一瞬间或某一时点)数量表现的数据。 例如,2007年年末全国总人口为132129万人 。


时期数 是描述某种现象在某一个特定时间范围 内所实现的成果的数据。例如,2004年我国全年 各种运输方式完成货物运输周转量66698亿吨公 里。 区分数据是时点数还是时期数的方法之一看其加 总后的结果是否有意义。若有意义则该指标必定 是时期数。反之,则必定是时点数。
中央财经大学统计学院
10
课程重点



掌握各种统计方法的原理和应用范围 使用统计软件实现这些统计方法的能力 能够用 SPSS进行统计分析,熟悉 SPSS的输出结果 对计算机输出结果的解释和使用能力
中央财经大学统计学院
11
课时安排和考核方式


总课时:54,3学分 考核: 期末统一的闭卷考试:70%。 课程作业:30%。
中央财经大学统计学院
12
关于课程作业(1)


ห้องสมุดไป่ตู้
课程提供的作业题目供任课教师参考(在网站公 布),任课教师可以提出不同的作业题目和要求。 作业建议分三次提交。占总成绩的30%。 第一次作业包括问卷设计,描述统计分析、假设 检验; 第二次作业包括方差分析、非参数检验、回归分 析、时间序列分析; 第三次作业包括统计指数计算、主成分与因子分 析、聚类与判别分析、列联表和对应分析。
相关主题