当前位置:文档之家› 总体分布样本分布

总体分布样本分布


xi
易见,Xi其实就是X
5.1.3 样本分布函数
设x1, x2, …, xn是随机变量X的样本观察值,将它 们按大小顺序排列,排序后为x1x2 … xn , ki为 小于xi+1的样本值出现的累积频次,n仍为样本容 量,则可得到样本累积频率分布函数如下
Fn
(x)

0ki,
当x x1 / n, 当xi
因此,总体也可理解为一个随机变量取的值全体。
5.1.1 总体与总体分布
更准确地说,一维随机变量是指反映某总体特征取 值,且具有如下特点的变量X: (1)在同一条件下可以无限次重复取值; (2)取值的结果可能有多个,但不确定; (3)事先不知道取值结果(Outcome)。
由此可知,随机变量可以理解为“随机实验(随机地抽取一个 个体)”结果的数值性描述。
f(x)
b
a f (x)dx P(a x b)
x ab
连续型随机变量取给定值的概率为零。 有时也称下式定义的函数为X的概率分布函数:
F(x) x f (x)dx
5.1.2 随机样本与样本观察值
从重复抽样的角度看“每次从总体中随机抽取个体” 可理解为一个随机实验。
随机样本:表征n次抽取个体的随机抽样的一组随 机变量X1, X2, …, Xn. 样本观察值(样本数据):n次随机抽样的结果: x1, x2, …, xn(称为随机变量X1, X2, … , Xn的样本观 察值)。n称为样本容量。 注:x1, x2, …, xn也可以看成随机变量X的n次重复抽 样的结果。
概率的定义(见教材p2)。
任何满足定义中三个条件的函数P(A)都可以作为一种合适 的概率分配方式。常用的概率分配方式有:古典法(抛掷 硬币)、相对频数法(产品销路调查)和主观法(体育比 赛结果预测)。
5.1 总体分布与样本分布
本章的总体(Population or Universe)是指研究对象 的全体。并且先研究只有一个特征(指标或变量) 的总体。这样表述总体特征的变量可以看成一个 一维随机变量。
无论是理论研究还是解决实际问题,知道一个随机变量取 各种可能值的概率情况(概率分布)都是十分重要的。
随机变量取值的概率分布,就称为总体分布。
一个随机变量取给定值或属于一给定值集合的概率 所确定的函数称为该随机变量的概率分布。概率分 布反映的是随机变量所有可能取值的概率的分配方 式。一旦与所有可能结果相联系的概率被确定,则 概率分布完全确定。
大写的英文字母:随机变量 小写的英文字母:随机变量的观察值
1,2,3,4,5,6。用X标识骰子落地后 朝上一面的数字。则X是离散随机变量。
对该随机变量进行一次抽样,其实就是掷该骰子 一次。
第i次抽样,就是第i次掷骰子,其结果的表示:
事前
事后
Xi
X
x1
P(X) p1
x2 … xn … p2 … pn …
(1)离散随机变量的概率分布
离散随机变量的概率分布。设X为取相异
值x1, x2, … xn, …的离散随机变量,则函

f
(x)

P( X 0,

xi ), i 1,2,, n, X xi
称为X的概率分布或概率分布函数 (probability distribution function, PDF),其 中P(X=xi)为离散随机变量X取xi值的概率。
• 某项工程按期完成的“可能性”有多大?
• 新投资赢利的“机会”有多大? 概率在决策过程中起着重要作用,它提供了一种机制来衡 量、表达和分析与未来事件相联系的不确定性。
一些相关概念
随机实验 至少有两个或两个以上的结果但事先不知道会发 生哪个结果的过程。 随机事件(简称为事件) 一个随机实验的可能结果称为基 本事件。所有基本事件的集合称为总体(样本空间)。总 体的子集称为随机事件。
5.1.4 格利文科(Glivenko)定理 (样本分布与总体分布的关系)
格利文科定理:当n趋于无穷大时,Fn(x)依概率1 (关于x)均匀地收敛于总体分布F(x).
例如 我们在某个研究中关注广州市的某区居民的某年经济 收入情况, 我们在这个问题中的总体就是广州市某区居民的 全体, 但我们实际上关注的是该区居民该年的经济收入这样 一个特征, 我们可以用一个变量X来表征我们任意选取的一 个该区居民该年的收入。则X是一个一维随机变量,而我们 研究的总体实际上是这一随机变量取值的全体。
x

xi1
1, 当xn x
样本累积频率分布函数又简
称为样本(累积)分布函数,
它是总体(累积)分布函数
的近似,n越大,就越接近总
体分布,如图。
对于有限总体,其 累积概率分布函数 不连续, 是阶跃式的。 样本的累积分布函 数也是阶跃式的。 如图所示。
样本(累积)分布函数是总体(累积)分布函数的 近似,n越大,就越接近总体分布
(2)连续随机变量的概率密度函数
设X是连续随机变量,x是X取的值,若函数f(x)满 足下列条件:
f (x) 0

f (x)dx 1
b
a f (x)dx P(a x b)
则称f(x)为X的概率密度函数(probability density function, PDF),其中P(a<xb)表示X在区间(a, b] 取值的概率。
提示
• 如何依据样本的信息推断总体的特征— —参数估计问题
总体

样本统计量

例如:样本均
值、比例、方

有关概率概念的回顾
通俗地说:概率是衡量某一特定事件的机会或可能性的数 值度量。它可以用来度量如下一些问题中的可能性 • 如果提高产品的价格,则销售下降的“机会”有多少?
• 某种新的装配作业方法会在多大“可能性”上提高生 产率?
120
100
80
60
Cumulative Percent
40
20
0
Missing 3
5
7
9
11
13
15
17
19
0
4
6
8
10
12
14
16
18
20
Highest Year of School Completed
1991年美国一般社会调查(1991 U.S. General Social Survey)数据 中被调查对象”接受学校教育的最高年限”的样本累积分布图
相关主题