样本及其分布
并称他们相应的观统测称值为x
样n1
本n xi
i 1
,矩
s2n11in1(xi x)2,
s n11 in1(xi x)2,
a
k
1 n
n i 1
xik
,
bk n1in1(xi x)k, k=1,2,…
仍分别为: 样本均值、样本方差、样本标准差、样本 k 阶原点矩、 样本 k 阶中心矩.
统ex计3.量的重要性质 设 X1, X2, …, Xn 是来自总体 X 的容量为 n 的样本,
1、估计这批合金材料的强度均值是多少? (参数的点估计问题) 2、强度均值在什么范围内? (参数的区间估计问题) 3、若规定强度均值不小于某个定值为合格,那么这 批材料是否合格? (参数的假设检验问题) 4、这批合金的强度是否服从正态分布? (分布检验问题) 5、若这批材料是由两种不同工艺生产的,那么不同 的工艺对合金强度有否影响?若有影响,那一种工艺 生产的强度较好? (方差分析问题)
当个体个数很大时通常把有限总体看作无限总体。
从另一方面看: 统计的任务,是根据从总体中抽取的样本, 去推断总体的性质. 由于我们关心的是总体中的个体的某项指标(如人的身高、体重, 灯泡的寿命,汽车的耗油量…), 所谓总体的性质,无非就是这 些指标值集体的性质. 概率分布是刻划这种集体性质最适当的工具. 因此在理论上可 以把总体与概率分布等同起来. 如研究某批灯泡的寿命时, 关心的数量指标就是寿命, 那么, 此 总体就可用描述其寿命的随机变量 X 或用其分布函数 F(x)表示.
6、若这批合金 由几种原料用不同的比例合成,那么 如何表达这批合金的强度与原料比例之间的关系?
(回归分析问题) 我们依次讨论参数的点估计、区间估计、假设检验等 内容。 首先我们讨论数理统计中的一些基本概念。
第5章 样本及其分布
在数理统计中,我们所研究的随机变量 的分布往往是未知的,通过对随机变量进行 多次独立重复的试验和观测,获取数据,利 用实际观测数据研究随机变量的分布,对其 分布函数、数字特征等进行估计和推断.
数理统计
Tel: Email:
数理统计的基本概念
在概率论中,我们所研究的随机变量,它的分布 都是假设已知的,在这一前提下去研究它的性质、 特点和规律性,例如求出它的数字特征,讨论随机 变量函数的分布等。但是对一个实际问题,随机变 量的概率分布往往是不知道的,如何确定随机变量 的概率分布或数字特征就是数理统计要解决的问题。
简单随机样本是应用中最常见的情形, 今后, 说到 “X1, …, Xn 是取自某总体的样本”时, 若不特别说明, 就指简单随机样本.
若总体 X的分布函数为F(x), 则其简单随机样本的联合分布函数为 n F(x1, x2, …, xn )= F(x1)F(x2)…F(xn) F ( xi ).
若总体 X 的概率密度为 f (x), 则其简单随机样本的i1联合概率密度为 n f(x1,,xn)f(xi). i1
在数理统计中总体X的分布永远是未知的,即使 有足够的理由可以认为总体X服从某种类型的分布, 但这个分布的参数还是未知的。
例如本市家庭的月收入X是个随机变量,X服从什么
分布事先是不清楚的,根据资料可确信 X~N ,2.
但 , 2 究竟取什么值还是未知的,
由于总体X的分布是未知的,因此X的数字特征如 均值、方差等往往也是一个未知的值。对于这些未知
× 3
i1
(
X
i
)2
我们主要研究两种基本的统计量: 样本矩 和 顺序统计量
10 样本矩 ——
样本均值
X
1 n
n
i 1
反映了总体均值的信息
几个常见的统计量
它反映了总体标准差的信息
Xi
样本标准差 S n11 in1(Xi
X)2
它样它反本反样映映了本k了阶总方总体原体差k点方阶S差矩矩2的的A信n信k1息息1n1 in1in(1XXiikX)2n 样反1 映1 本(了 iSn kn总1阶X 体i2n1中 iknn 212(阶心nXX X Xi中2 矩 i 2n ) X心1)X 2矩nBSiXk的 n22n 信)X n1n1息2in)in11((XXiki=1X,X2)k,)…2
总体(理论分布)?
样本值
样本
统计是从手中已有的资料 — 样本值, 去推断总体的情况 —总体
分布F(x)的性质. ? ?样?本是联系二者的桥梁
总体分布决定了样本取值的概率规律,也就是样本取到样本值
的规律, 因而可以由样本值去推断总体.
分散、复杂
是总体的代表, 含有总体的信息
§2 统计量
1. 统计量
由样本值去推断总体情况, 需要对样本值进行“加工一个有效
若 X 有期望 EX= 和方差 DX = 2, 则
(1)
EX
1
n
n i1
EXi
=DX,
1 n2
n
DXi
i1
= 2/n ;
(2) E(S2) =? 2 ,
E(Sn2)
?n
n
1
2
;
n
11n1
n
E[(Xi X)2] i1
n
E(Xi2)nE(X2) i1
in 1(DXiE2Xi)n(DXE2X)n(22)n(n22)
再如, 若研究某地区中学生的营养状况时, 关心的数量指标是身 高和体重, 我们用X和Y分别表示身高和体重,那么此总体就可用二 维随机变量(X,Y)或其联合分布函数 F(x, y)来表示.
总体概念的要旨: 总体就是一个概率分布
当X为离散型时,称X的概率函数(分布列)为 总体概率函数。 当X为连续型时,称X的概率密度为总体密度函数。 当总体分布为指数分布时, 称为指数分布总体; 当总体分布为正态分布时,称为正态分布总体或 简称正态总体等等.
计 推断统— 计学—
的
对已取得的观测值进行整理、
分
分析,作出推断、决策,从而
类
找出所研究的对象的规律性
推断 统计学
参数估计 (第6章) 假设检验 (第7章) 方差分析 (第8章) 回归分析 (第8章)
例如 某厂生产一型号的合金材料,用随机的方法选取 100个样品进行强度测试,于是面临下列几个问题:
的方”法, 就是构造一些样本的函数, 通过样本函数把样本中所含的
(某一方面)的信息集中起来.
样本的函数
这种不含任何未知参数、完全由样本决定的量称为统计量
定义 设X1, X2, …, Xn 是来自总体 X 的容量为 n 的样本, 若样本函数 g(x1, …, xn)中不含任何未知参数, 则称 g(x1, …, xn)是
数理统计是一个内容十分丰富的数学分支。 它既有严格的理论,更有极其广泛的应用。而且 随着科技的发展其研究内容还在不断地充实提高。
数理统计学是一门应用性很强的学科. 它 是研究怎样以有效的方式收集、 整理和分析带 有随机性的数据,以便对所考察的问题作出推 断和预测,直至为采取一定的决策和行动提供
依据和建议.
(n1)2,
DCXC2X
DXEX2EX2
2 顺序统计量与极差
设 (X1,X2,,Xn) 为样本, (x1,x2,,xn)为样本值,且 x1 *x2 *xn * 当 (X1,X2,,Xn)取值为(x1,x2,,xn)时, 定义 r.v. X(k) xk*,k1,2,,n 则称统计量X(1),X(2),,X(n) 为顺序统计量.
另一类是研究如何分析所获得的随机数据,对所研究 的问题进行科学的、合理的估计和推断,尽可能地为 采取一定的决策提供依据,作出精确而可靠的结论. 这部分的内容称为推断统计学,如:参数估计、假设 检验等。
我们主要讨论有关推断统计学中几个最基本的 问题。
描述统—计—学
数
对随机现象进行观测、试验,
理 统
以取得有代表性的观测值
体进行观察试验以获得有关总体的信息. 这一抽取过程称为抽样,
所抽取的部分个体称为样本. 样本中所包含的个体数目称为样本容
量.
从国产轿车中抽5辆 进行耗油量试验
样本容量为 5
抽到哪 5 辆是随机的!
样本是随机变量
容量为 n 的样本可以看作一 n 维随机变量(X1, X2, …, Xn). 但是,一旦取定一组样本,得到的是 n 个具体的数 x1, x2, …, xn , 称为样本(X1, X2, …, Xn)的一组观测值,简称样本值 .
本章作为数理统计基础,学习总体、样 本、统计量与抽样分布等有关概念,以及有 关正态总体的重要的抽样分布定理.
5.1 简单随机样本
一.总体和样本 二.统计量
§1 总体和样本
1.总体 一个统计问题总有它明确的研究对象.
研究对象的全体称为总体(母体),总体中每个对象称为个体.
总体 研究某批灯泡的质量
该批灯泡寿命的全体就是总体
总体
每公里的耗油量
灯泡的寿命
考察国产 轿车的质量
所有国产轿车每公里耗油量的全体就是总体
不过在统计研究中,人们关心总体仅仅是关心
其每个个体的一项(或几项)数量指标和该数量指标在总体中的分布
情况. 这时,每个个体具有的数量指标的全体就是总体.
称总体中所含个体的数目为总体容量, 总体容量有限的称为有 限总体, 总体容量无限的称为无限总体.
样本的值域称为样本空间。
抽样的目的是为了对总体进行统计推断,为了使抽取的样本能 很好地反映总体的信息,必须考虑抽样方法.
最常用的一种抽样方法叫作简单随机抽样, 它要求抽取的样本 X1, X2, …, Xn 满足下面两点:
1.独立性: X1, X2, …, Xn 是相互独立的随机变量 ; 2.代表性: Xi (i =1,2,…,n) 与所考察的总体 X 同分布. 由简单随机抽样得到的样本称为简单随机样本,它可以用与总体 同分布的 n 个相互独立的随机变量 X1, X2, …, Xn 表示.