当前位置:
文档之家› 管理学研究方法04-统计分析方法(一)
管理学研究方法04-统计分析方法(一)
μ4=E(X-EX)4是X的四阶中心矩,σ是X的标准差 Ek=0,正态分布。通常, Ek越小,曲线分布的峰越陡峭; Ek 越大,曲线分布的峰越平坦。
三、 统计推断—参数估计
抽样与抽样分布 参数估计(点估计) 参数估计(区间估计) 假设检验(关于总体均值、总体比例、总体 方差)(单个总体、两个总体)
★ 有数据、用数据的地方,就要用统计学方法!
一、统计学与数据
1. 什么是统计学
统计学是一门对群体现象的数量特征进行描述、分析和 推论的科学 要点: ☆ 研究对象→ 群体现象大量性 ☆ 研究内容→ 群体现象的数量表现的内在规律性 ☆ 研究目的→ 计量、描述、分析和推论
2. 统计学在经济和管理中的应用
☆ 经济 :物价、经济增长、就业、贸易、生活 ☆ 管理:计划、组织、营销、生产、成本、财务、质量 ◆ 还广泛应用于各个领域和各个方面:医药、生物、物 理、农林、社会学、人口学、文学、体育等
3. 数据及其类型和来源
数据: --数据类型 (按分布形式、来源、性质、时序分) --数据来源 (官方、半官方(企业)、研究机构或个人、媒体)
Frequency
10
8 6 4 2 50 60 70 80 90 100 110
Cost ($)
--cont’
累计分布(Cumulative Distributions)
Cost ($) < 59 < 69 < 79 < 89 < 99 < 109
累计频数 2 15 31 38 45 50
累计频数 .04 .30 .62 .76 .90 1.00
n 1
--cont’
2. 相关系数(Correlation coefficient)
-- 两个随机变量间线性相依程度的度量。
-- 定义:
xy
cov(X , Y )
x y
-- 性质: 0≤│ρxy│≤1; ρxy= 0,X与Y独立; ρxy= -1,完全负相关 ;ρxy=+1,正相关 -- 样本相关系数: s
累计频数 4 30 62 76 90 100
--cont’
累计曲线(Ogive)
Cumulative Frequency
50
40
30 20 10 50 60 70 80 90 100 110
累计曲线的意义与应用
Cost ($)
2.3 数据的度量
1. 集中趋势 (位置,location ) 的度量 (measures of central tendency) * 平均数 (mean) x xii
管理学研究方法(4) --统计分析方法(一)
学习目标
了解和认识统计数据在管理研究中的重要作用 理解、掌握统计数据处理的基本方法 理解、掌握统计学的基本概念和基本方法(描 述统计、统计推断、抽样调查) 理解、掌握数据分析的基本技术与方法(方差 分析、相关分析、因素分析、回归分析) 学会应用Microsoft Excel、SPSS进行数据处理、 数据分析、模型估计、假设检验等。 学会用统计分析方法研究实际的管理学问题。
91 71 104 85 62 78 69 74 97 82 93 57 72 89 62 68 88 68 98 101 75 52 99 66 75 79 97 105 77 83 68 71 79 105 79 80 75 65 69 69 97 62 72 76 80 109 67 74 62 73
1. 协方差(covariance) --两个随机变量的联合数字特征,相依存程 度的度量。 -- 定义:cov(X,Y)=E[(X-EX)· (Y-EY)] = E(XY)- EX· EY n _ _ -- 样本协方差: ( xi x)( yi y)
s xy
i 1
-- 协方差的解释:
1. 抽样及抽样分布
★ 总体与样本 ★ 总体参数:总体分布的数字特征 ★ 统计推断:根据样本信息推断总体的数量特征, 及对总体参数的估计和检验。 ★ 简单随机抽样 a. 有限总体 -- 等可能性 b. 无限总体 -- 独立地被抽到
--cont’
★ 抽样分布 a. 一个实例 -EAI _ b. x 的分布 _ _ 的均值: E ( x ) = x _ x 的标准差: N n or
--cont’
– –
Frequency Distribution
选择组数:
5 ~ 20 组之间 数据集与组数对应(数据集大→组数大,数据集 小→组数小)
选择组宽:
– –
等距分组 Largest Data Value Smallest Data Value 近似组宽 = Number of Classes
n
* 中位数 (median) * 众数 (mode) * 四分位数和百分位数 (quartiles & percentiles)
-- cont’
2. 离散趋势的度量(measures of dispersion) * 全距(极差) : Range = Xmax - Xmin * 四分位数间距(interquartile range): d=Q3 - Q1 * 方差 (variance) (样本) 2 2 ( x x ) i 2 s2 n1 * 标准差 (standard deviation)(样本):s
--cont’
Frequency Distribution 如果选择6组, 近似组宽 = (109 - 52)/6 = 9.5 10 Cost ($) Frequency 50-59 2 60-69 13 70-79 16 80-89 7 90-99 7 100-109 5 Total 50
--cont’
2.1 数据的搜集
原始数据的搜集 * 统计调查方式: 定期统计报表 普查 抽样调查 典型调查 重点调查 * 统计调查方案 * 问卷调查---民意测验 二手数据的搜集:年鉴、年报、出版物
2.2 数据整理与汇总
数据分组 分组:将总体所有单位按一定的标准区分为若干部分, 以此将具有某种共性的个体归入同一组,而将总体内部 个体间的差异通过组别区分开来。 分组标准:数量标志、品质标志、混合分组 频数及频数分布 频数:具有某种属性的个体在某一组中出现的次数。 频数分布:一列表明各组数据频数(个数)的汇总表, 它描述了总体的结构和分布特征。 相对频数:每组的频数/n 累计频数:各组相对频数的累加
rxy
xy
sx s y
-- 相关系数的解释:
2.5 分组数据的度量
1. 加权平均
x
_
w x w
i i
i
2. 统计分组:意义、方法、要点 _ fi M i 3. 分组数据的平均数 x
n
4. 分组数据的方差
s2n 1
_
5. 分组数据的标准差 : s
相对频数与百分比频数分布 Cost ($) 相对频数 百分比频数(%) 50-59 .04 4 60-69 .26 26 70-79 .32 32 80-89 .14 14 90-99 .14 14 100-109 .10 10 Total 1.00 100
--cont’
18 16 14 12
直方图(Histogram)
* 经验规则 (3 -- 规则)
--cont’
4. 探索性数据分析 --五数概括法: a. 最小值(min) b. 第1四分位数(Q1) c. 中位数(Q2) d. 第3四分位数(Q3) e. 最大值(max) --盒形图(箱线图):用图形概括数据(上述 5个数据)。
2.4 两个变量间关联的度量
3. 参数估计 -- 区间估计 区间估计的基本概念 区间估计的基本步骤 总体均值的估计 总体比例的估计 总体方差的估计 样本大小的确定
3.1 区间估计的基本概念 区间估计的基本思想:首先求出待估参数的估计 值,然后以此为基础估计出一个区间 ( , ),并 提供总体参数落入该区间的概率。 以概率表示为: P 1 置信区间:以一定的概率保证的总体参数可能落 入的区间,区间 ( , ) 。 置信度或置信水平:(1 -α )100% 显著性水平(Significance Level):α 置信度为(1 -α )100%的置信区间的解释
_
x
N 1 n
_ x n
--cont’
★ 中心极限定理: 从总体中抽取样本容量为 _ n的简单随机样本,当样本 容量很大时,样本均值 x 服从近似的正态分布。 ★ 抽样误差: _ x sampling error = _ ★ 样本容量与 x 的抽样分布的关系 增大样本容量,样本均值落在总体均值某一特定范 围的概率将随之增大。 _ ★ 样本比例 p 的抽样分布 _ E ( p) = p
-- cont’
4. 统计学的分类
* 描述统计学和推断统计学 * 理论统计学和应用统计学
5.
统计分析方法与思想概述
* 统计学的要素:总体、样本、描述、推断、推断的可靠性 * 统计学的方法:数据搜集、整理、度量、描述、分析、推断、 预测、决策
二、 描述统计学
数据的搜集 数据的整理与汇总 数据的度量 两个变量间关联的度量 分组数据
--cont’
组数与组宽(距) 组限 组中值 直方图 频数多边形 累积曲线 统计图 统计表
Example: Hudson Auto Repair
The manager of Hudson would like to get a better picture of the distribution of costs for engine tune-up parts. A sample of 50 customer invoices has been taken and the costs of parts, rounded to the nearest dollar, are listed below.