当前位置:
文档之家› 统计学 第一章 统计学的基础理论
统计学 第一章 统计学的基础理论
2019/2/6
11
三、统计学的应用
说出哪些领域运用统计,哪些领域不运用统计,都很困难 几乎找不到一个不用统计的领域 统计是适用于所有科学领域的通用数据分析方法 只要有数据的地方,都会用到统计
一切社会科学 领域 统计的 应用 一切自然科学 领域 一切人类生活 领域
2019/2/6
一切生产活动 领域
2019/2/6
定距尺度
存
定比尺度
14
二、数据的类型
15
2019/2/6
不同计量尺度的数据
分类数据 是只能归于某一类别的非数字型数据。如,人口的性别:男和女; 产品类别:食品、衣着、家电等; 顺序数据 是只能归于某一顺序类别的非数字型数据。如产品的质量等级:一 等品、二等品等; 数值型数据 是按数量尺度测量的数据。一般可直接进行加减乘除运算,且使用 自然、物理、货币等单位计量。 分类数据和顺序数据说明是事物的品质特征-----品质数据或定性数 据; 数值型数据是说明事物的数量特征----定量数据
16
2019/2/6
不同搜集方法的数据
观测数据: 通过调查或观察而搜集到的统计数据。如有关社会经济数据均 为观测数据。 试验数据: 在试验中,利用监控手段,通过控制试验对象而搜集到的统计 数据。如对医药疗效试验数据;生物成长的试验数据等。
观测数据一般不能再生,只能通过观察得到;大多数试验数据 来源于科学实验,一般可以重复取得。
进分布
按属性不同,可分为理论分布与经验分布
按涉及的随机变量的性质不同,可分为离散变量
的概率分布与连续变量的概率分布
27 2019/2/6
总体分布、样本分布、抽样分布
总体分布
总体中各元素的观察值所形成的相对频数 (频率)分布。 分布通
常是未知的(因为几乎得不到总体所有观察值),可以(根据理论 分析)假定它服从某种分布
样本分布
一个样本中各观察值形成的相对频数(频率)分布, 也称经验分
布 。当样本容量n逐渐增大时,样本分布逐渐接近总体的分布
抽样分布
样本统计量的概率分布,是一种理论分布在重复选取容量为n的
样本时,由该统计量的所有可能取值形成的相对频数分布
28 2019/2/6
理论分布与经验分布
,方差为
2
的正态分布,记
( 0 , 1 ) 标准正态分布: X N
32
3 准则
2019/2/6
2Fra bibliotek分布
n 2 i
, X , , X 设随机变量 X 相互独立,且 X i 1 , 2 , , n ) 1 2 n i(
服从标准正态分布 N ( 0 , 1) ,则它们的平方和
自由度为 n 的
样本
从总体中抽取出来,作为代表这一总体的部分单位组 成的集合体称为样本。
24
2019/2/6
二、参数和统计量
参数
用来描述总体特征的概括性数字度量 参数一般是未知常数
统计量
用来描述样本特征的概括性数字度量
统计量是随机变量
可以由样本数据计算出来
2019/2/6
25
三、变量
2
X
分布。记为
2
2(n )
i1
服从
2
分布的期望与方差分别为:
E(X ) n D ( X ) 2n
2
2 2 分布的上侧分位值定义为: P ( )
33
2019/2/6
t
分布
2(n) ,且X与Y独立,
设随机变量 X N , Y ( 0 , 1 ) 则随机变量:
12
第二节
统计数据
一、数据的计量尺度 二、数据的类型 三、数据的来源 四、数据的调查方式 五、数据的调查方法 六、数据的质量要求
13 2019/2/6
一、数据的计量尺度
定类尺度
根据调查对象的性质进行分类,各类之间是并 列关系。
定序尺度
测度多类别之间不同程度的顺序关系,存在类 别差和顺序差。
测度顺序和各顺序位置之间的距离。这种尺度不 存在绝对“0”点,“0”在此处是有意义的数字。 与等距量表是一个等级,但该尺度存在绝对 “0”点,“0”在此处表示不存在,故可计算比率。
2019/2/6
第三节 统计学的基本概念
一、总体和样本 二、参数和统计量 三、变量 四、概率分布
23
2019/2/6
一、总体和样本
总体
就是根据一定目的确定的所要研究事物的全体。它是 由客观存在的、具有某种共同性质的许多个别事物构 成的整体,简称为总体。
构成统计总体的个别事物则称为总体单位。
34
F
分布
设随机变量Y与Z相互独立,且Y和Z分别服从自由度为m
2 和n的 分布,则随机变量X:
Y /m X Z /n 服从第一自由度为m,第二自由度为n的 F
分布
F
分布与
t
分布存在如下关系:如果随机变量 X服从
F (1 , n ) 的
t ( n ) 分布,则X2服从
F 分布。
分布的期望与方差分别为:
2019/2/6
29
精确分布与渐进分布
精确分布 在总体X的分布类型已知时,若对任意自然数 n ,都能导 = T ( X , X , , X ) 出统计量 T 的分布的数学表达式,这 1 2 n 种分布称为精确的抽样分布。它对样本量较小的统计推断 非常有用。精确分布大多数是在正态分布情况下得到的。 渐进分布 在统计学的抽样分布理论中,至今已求出的精确分布并不 多。抽样分布很难求,即便求出来精确的抽样分布,也因 为过于复杂而难于应用。因此,人们往往寻求在样本量无 限增大时统计量的极限分布,这种极限分布常称为渐进分 布。
理论分布 根据数学原理,所推导出来的随机变量的分布模型。对于 离散随机变量,常用的理论分布模型有 两点分布、二项 分布、泊松分布、超几何分布;对于连续随机变量,常用 的理论分布模型有正态分布、指数分布、均匀分布,以及 由正态分布导出的 t 分布、 2 分布、F 分布(统计三大 分布)。
经验分布 一个样本中各观察值形成的相对频数(频率)分布。这种 分布是可知的,是一种实际发生的分布。
2019/2/6
9
理论统计学(Theoretical Statistics)
是指统计学的数学原理,它主要研究统计学 的一般理论和统计方法的数学理论。 从事统计理论和方法研究的人员需要有坚实 的数学基础。
由于概率论是统计推断的数学和理论基础, 因而广义地讲统计学也应该包括概率论在内。
2019/2/6
t
服从自由度为 n 的
X Y /n
随着自由度 n 的增加,t 分布 的密度函数越来越接近标 准正态分布的密度函数。实际应用中,一般当n ≥30时,
t
分布,记为
t ( tn )
t t
分布与标准正态分布就非常接近。
分布的数学期望与方差分别为
( n 2) n n2
2019/2/6
E (t ) 0 D (t )
2019/2/6
17
不同时空属性的数据
截面数据
在相同或近似相同的时间点上搜集的数据;描述多个现象在 某一时刻的变化情况;比如,2010年我国各地区的国内生产 总值数据。
时序数据
在不同时间上搜集到的数据;描述一个现象随时间变化的情 况;比如,1990年至2010年国内生产总值数据。
混合数据
6
2019/2/6
二、统计学的分科
7
2019/2/6
描述统计学(Descriptive Statistics)
研究如何取得反映客观现象的数据,并通过图 表形式对所搜集的数据进行加工处理和显示, 进而通过综合、概括与分析得出反映客观现象 的规律性数量特征。 主要内容: 统计数据的搜集方法; 数据的加工处理方法; 数据的显示方法; 数据分布特征的概括与分析方法等。
n E ( F ) ( n 2 ) n 2 2 n ( m n 1 ) D ( F ) m ( n 2 ) ( n 4 )
2019/2/6
35
36
2019/2/6
37
2019/2/6
在数据集中含有时间序列和截面数据成分的数据;描述多个 现象随时间变化的情况;比如, 1990年到2010年我国各地区 的国内生产总值数据。
18 2019/2/6
三、数据的来源
19
2019/2/6
四、数据的调查方式
20
2019/2/6
五、数据的调查方法
21
2019/2/6
六、数据的质量要求
22
2019/2/6
8
推断统计学(Inferential Statistics)
是研究如何根据样本数据去推断总体数量特征 的方法,它是在对样本数据进行描述的基础上, 对统计总体的未知数量特征作出以概率形式表 述的推断。
主要内容:
参数估计:利用样本信息推断总体特征 假设检验:利用样本信息检验对总体的某个假 设是否成立
3
2019/2/6
第一章
统计学的基础理论
第一节 统计学及其应用领域 第二节 统计数据 第三节 统计学的基本概念
4
4
2019/2/6 2019/2/6
第一节
统计学及其应用领域
一、统计学的定义 二、统计学的分科 三、统计学的应用