当前位置:文档之家› 统计学之抽样与抽样分布

统计学之抽样与抽样分布


的抽样分布
统计推断的过程
• 总体均值
m=?
• 从总体中抽取 • 样本容量为 n 的样本
• 用 作为m 的点估计
• 计算样本平均值
的抽样分布
的抽样分布是指所有可能的样本平均值 的概率分 布
的期望值
E( ) = = 总体平均值
的抽样分布
的标准差

有限总体
无限总体
• 当 n/N < .05时,可以将一个有限总体看作是无限
统计学之抽样与抽样分 布
2020年4月29日星期三
Chapter 7
抽样和抽样分布
本章主要内容
简单随机抽样 点估计 抽样分布 样本平均值 的抽样分布 样本比例 的抽样分布 抽样方法
•n = 100
•n = 30
统计推断
统计推断的目的是利用样本的信息推断总体的信息 总体是指感兴趣的所有元素的集合 样本是总体的一个子集 通过样本统计量对总体参数进行估计 只要抽样方法恰当,通过样本统计量可以对总体参数 进行很好的估计
也就是说,样本平均值在总体平均值+/-10分范围内的 概率为0.5036
•面积 = 2(.2518) = .5036
• 的抽样分布
•980 •990•1000
的抽样分布
的抽样分布是指所有可能的样本比例 的概率分布 的期望值
p = 总体比例
的抽样分布
的标准差 有限总体
无限总体
• 也称为样本比例的标准误
总体

称为有限总体校正因子.
• 也称为样本均值的标准误
的抽样分布
中心极限定理:只要样本容量足够大 (n > 30),不管总 体服从什么分布,样本平均值 都可以认为近似服从 正态分布。
如果样本容量不够大 (n < 30), 只有在总体服从正态分 布的条件下,样本平均值 才可以认为服从正态分布
申请人平均成绩 的抽样分布 •
申请人中没有类似工作经验者的比例 的分布
已知总体比例p=0.72,则: np = 30(.72) = 21.6 > 5
n(1 - p) = 30(.28) = 8.4 > 5 所以样本比例 近似服从正态分布

样本比例 在总体比例p+0.05范围内的概率为多 大?换句话说,样本比例在0.67至0.77之间的概率有多 大?
• 的抽样分布 •面积 = ?
•0.67 •0.72 •0.77
0.67和0.77对应的 z =+ .05/.082 = +.61, 相应面积 = (.2291)(2) = .4582.
•面积 = 2(.2291) = .4582
• 的抽样分布
•0.67 •0.72 •0.77
分层抽样 集群抽样 系统抽样 方便抽样 判断抽样
举例:海珠保险公司
海珠保险公司招聘保险经纪人,共有900人填写了申请 表并参加了考试。总经理希望知道平均考试成绩,以 及有多少比例的申请者从来没有相同的工作经验。
可以用以下三种方法满足总经理的要求:
• 统计所有900个申请者的考试成绩和工作经验 • 使用随机数表随机选择30个申请者作为样本进行研
申请者编号
No. 744 No. 436 No. 865 No. 790 No. 835 超过 900 No. 190 已经出现过
etc.
No. 随机数
1 744
2 436பைடு நூலகம்
3 865
4 790
5 835
.
.
30 685
申请人 小强 小丽 阿花 小伟 大雄
. 阿健
考试成绩
1025 950 1090 1120 1015 . 965
简单随机抽样
有限总体
• 从一个容量为N的总体中进行简单随机抽样,是指
使得任何一个样本容量为n的样本被抽中的概率相 等
• 有限总体的简单随机抽样可以分为有放回抽样和无
放回抽样
• 通常最多使用的是无放回抽样
简单随机抽样
无限总体
• 只要满足以下两个条件就可以认为是从无限总体中
进行了简单随机抽样 • 抽中的每个元素都来自于同一个总体 • 每个元素都是独立抽取的

• 使用计算机生成随机数选择30个申请者作为样本进
行研究
考察所有900个申请者
• 考试成绩
• 总体平均成绩
• 总体标准差
考察所有900个申请者
• 无相同工作经验的申请者比例
• 总体比例
使用随机数表随机选择30个申请者作为样本进行研究, 从书上随机数表第三列开始
三位随机数
744 436 865 790 835 902 190 436 etc.
工作经验 无 无 有 无 有
. 无
通过Excel生成随机数进行抽样
•第10至第901行省略
•第10至第901行省略
•第10至第901行省略
点估计
• 作为 的点估计值
• s 作为 的点估计值
• 作为p 的点估计值
值得注意的是,不同的随机数会导致不同的抽样,也 就会导致对总体参数的不同的点估计值
在前面抽取的30个申请人作为一个样本,请问样 本平均考试成绩在总体平均考试成绩+10分范围内的概 率是多少?前面我们已经知道总体平均成绩为990分, 则换句话说,样本平均成绩在980分至1000分之间的概 率是多少?
•面积 = ?
• 的抽样分布
•980 •990•1000
980和1000对应的z值为+10/14.6=+0.68,通过标准正 态分布表,可以查到所求的面积=(0.2518)(2) =0.5036
简单随机抽样
无限总体
• 如果无法知道总体中究竟有多少个元素,或者总体
数量太大,通常可以认为是无限总体
• 对于无限总体,无法使用与有限总体相同的抽样方

点估计
使用样本统计量直接作为总体参数的估计,称为点估 计 如果点估计值的期望值等于总体参数,就称这个点估 计为无偏估计
抽样误差
无偏点估计值与总体参数之间的差的绝对值称为抽样 误差 抽样误差的存在是因为我们只用了部分数据(样本) 来估计总体的参数
的抽样分布
当样本容量足够大的时候, 可以近似认为服从正态 分布 与平均值的抽样分布不同的是,当满足下列条件时, 才可以认为是大样本:
np > 5 and
n(1 – p) > 5
•的抽样分布
如果 p 接近0.5, 样本容量只要到10就可以认为是大样本 而如果 p 接近于0或者接近1,则需要非常大的样本容 量才可以认为是大样本
抽样方法
End of Chapter 7
课堂练习
1. 样本统计量所有可能值的概率分布称为: a. 样本统计量 b. 总体参数 c. 简单随机抽样 d. 抽样分布
正确答案: d. 抽样分布
相关主题