当前位置:文档之家› 数理统计的基础知识

数理统计的基础知识


其中 x1, x2, , xn 在集合{0,1}中取值.
总体、样本、样本值的关系
事实上, 我们抽样后得到的资料都是具体的、确定的值. 比如我 们从某班大学生中抽取 10 人测量身高, 得到 10 个数. 它们是样本 取到的值而不是样本. 我们只能观察到随机变量取的值而见不到随
机变量.
总体(理论分布)?
则样本的概率分布为
p( x1,x2 ,
, xn ) P{ X1 x1, X2 x2 ,
n
p( xi ).
, Xn xn }
i 1
例 设总体X ~ P( ), ( X1, X 2 , , X n )为其样本,
则样本的概率分布为:
n
P{ X1 i1 , X2 i2 , , X n in } P{ X ik }
然而在统计研究中,人们往往关心每个个体的一项 (或几项)数量指标和该数量指标在总体中的分布情况. 这时,每个个体具有的数量指标的全体就是总体.
灯泡的寿命
国产轿车每公里 的耗油量
该批灯泡寿命的 全体就是总体
所有国产轿车每公里耗油 量的全体就是总体
由于每个个体的出现带有随机性,即相应的数量指标 值的出现带有随机性。从而可把此种数量指标看作随 机变量,我们用一个随机变量或其分布来描述总体。 定义 统计学中称随机变量(或向量)X为总体,并把
样本值
样本
统计是从手中已有的资料 — 样本值, 去推断总体的情况 —总体
分布F(x)的性质. ?样? 本? 是联系二者的桥梁
总体分布决定了样本取值的概率规律,也就是样本取到样本值
的规律, 因而可以由样本值去推断总体.
分散、复杂
是总体的代表, 含有总体的信息
二、统计量
由样本推断总体特征,需要对样本进行“加工”,“提 炼”.这就需要构造一些样本的函数,它把样本中所含 的信息集中起来.
1. 定义
定义4.3 设( X1, X2 , , Xn )为总体X的一个样本,称此样本 的任一不含总体分布未知参数的函数h( X1, X2 , , Xn )为 该样本的统计量.
解 总体 X 的概率分布为 P{X i} pi (1 p)1i
P{ X1 x1, X 2 x2 , , X n xn }
(i 0, 1)
P{ X1 x1}P{ X2 x2 } P{ Xn xn }
n
n
xi
n xi
pi1 (1 p) i1
获取方法
(1)有放回取样 (2)不放回取样(总体规模很大)
(3) 样本分布
样本(X1,X2, ,Xn)的联合分布.
设总体X ~ F( x),
样本(X1,X2, ,Xn),( x1,x2 , , xn )为样本值,
则(X1,X2 , ,Xn ) ~ F ( x1,x2 ,
n
, xn ) F ( xi )
第四章
数理统计的基础知识
数理统计是研究统计工作一般原理和方法的科学,它主要阐
述搜集、整理、分析统计数据,并据以对研究对象进行统计
推断的理论和方法,是统计学的核心和基础。
数理统计的任务就是在概率论的基础上研究怎样以 有效的方式收集、整理和分析可获得的有限的, 带 有随机性的数据资料,对所考察问题的统计规律性尽 可能作出精确而可靠的推断或预测,为采取一定的 决策和行动提供依据和建议.
数理统计与概率论是两个有密切联系的学科, 它们都以随机现象的统计规律为研究对象。 但在研究问题的方法上有很大区别:
概率论 —— 已知随机变量服从的分布规律, 寻求 分布的性质、数字特征、及其应用;
数理统计—— 通过对实验数据的统计分析,寻找 所服从的分布和数字特征, 从而 推断整体的规律性.
数理统计的核心问题——由样本推断总体
n维r.v.(抽样具有随机性)
样本容量:样本中所含的个体的数目n.
样本值:样本的一次观察值或实现值 ( x1, x2 , xn ).
(2) 简单随机样本 1. 代表性: X1,X2,…, Xn中每一个与所考察的总体X 有相同的分布.
2. 独立性: X1,X2,…, Xn是相互独立的随机变量.
满足上述两条性质的样本称为简单随机样本. 注:以后所考虑的样本均为简单随机样本, 并简称为样本.
数理统计的一般步骤: 数据资料的收集 数据的整理、分析
统计推断
4.1 总体与样本 4.2 统计量 4.3 常用的统计分布 4.4 抽样分布
一、总体与样本
1、总体与个体;总体分布
总体: 具有一定的共同属性的研究对象全体. 个体: 总体中每个对象或成员。
总体
总体 …
研究某批灯泡的质量
考察国产 轿车的质量
k 1
n ik e
sn
e n
k1 ik !
i1 !i2 ! in !
其中ik(1 k n)取非负整数,而sn i1+i2+ +in.
练习:设总体 X 服从两点分布b(1, p), 其中0 p 1, ( X1, X2 , , Xn )是来自总体的样本, 求样本 ( X1, X2 , , Xn ) 的概率分布.
i 1
称之为样本分布.
特别地,若设连续型总体X ~ f ( x), n
则样本(X1,X2, ,Xn)~ f ( x1,x2 , , xn ) f ( xi ). i 1
例 正态总体X ~ N (, 2),
样本(X1,X2 , ,Xn ),( x1,x2 , , xn )为样本值,
X ~ (x)
随机变量(或向量)X的分布称为总体分布.
通常,我们用随机变量X , Y , Z,…, 等表示总体。
注:总体的分布一般来说是未知的,统计学的主要 任务正是要对总体的未知分布进行推断.
正态分布总体
总体
有限总体 无限总体
总体
指数分布总体 二项分布总体

2、样本与样本值;样本分布
(1)样本:从总体中抽取的部分个体 ( X1, X2 , Xn ).
1
2
exp{
( x )2 2 2
}
n
(X1,X2, ,Xn )~ ( x1,x2 , , xn ) ( xi )
i 1

n
i 1
1
2
exp{
(
xi
2

2
)2
}
(

1
2
)n
exp{
1
2
2
n
( xi )2 }.
i 1
离散型总体X的概率分布为p( x) P{ X x},
相关主题