当前位置:文档之家› 第八章 抽样推断

第八章 抽样推断


全及总体指标: 全及总体指标:
参数(未知量) 参数(未知量) 统计推断
样本总体指标: 样本总体指标:统 计量(已知量) 计量(已知量)
随机样本 与总体分布 特征相同
与总体分布 特征不同 总体 非随机样本
并非所有的抽样估计都按随机原 则抽取样本,也有非随机抽样 则抽取样本,也有非随机抽样
抽样估计的特点
确定样本容量
样本的可能数目 在考虑顺序的抽样条件下,从总体 在考虑顺序的抽样条件下, N中随机抽取 个样本单位共有多少 中随机抽取n个样本单位共有多少 中随机抽取 种可能的抽选结果
⒈ 重复抽样的可能样本数目: 重复抽样的可能样本数目:
P
n N
= N ⋅N ⋯ N = N
共n个 个
n
不重复抽样的可能样本数目: ⒉ 不重复抽样的可能样本数目:
2 2
N
(
)
1
∑ fi
i =1
m
∑ (X
m i =1
i
−X
)f
2
i
总体成数: ⒋ 总体成数:
N1 N0 P = ,Q = = 1− P N N
总体是非标志的标准差: ⒌ 总体是非标志的标准差:
σ P = P(1 − P ) = PQ
(当P = Q = 0.5时,σ P 有最大值)
总体是非标志的方差: ⒍ 总体是非标志的方差:
主 要 形 式
名单抽样框 抽样框 抽样框
区域抽样框 包河区 瑶海区 蜀山区 庐阳区 政务区 技术开发区 ……
某外国公司在合肥进行 微波炉市场调查: 微波炉市场调查: 在商场的大门口 在微波炉柜台前 在市区街道旁边 在某个住宅小区
时间表抽样框
连续出产的产品总体可 以编制抽样框: 以编制抽样框:均匀的 出产时间、 出产时间、可以预见到 的产品总量。 的产品总量。
抽样方案设计的基本准则
㈠ 随机原则 ——抽取样本单位时,应确保每个总体单位都 抽取样本单位时, 抽取样本单位时 有被抽取的可能; 有被抽取的可能;在对样本单位的资料进行搜 集和整理时, 集和整理时,不能随意遗漏或更换样本单位 ㈡ 抽样误差最小 ——在其他条件相同的情况下,选抽样误差 在其他条件相同的情况下, 在其他条件相同的情况下 设计抽样方案时, 设计抽样方案时,通常是 最小的方案 在误差达到一定要求的条 ㈢ 费用最少 件下,选择费用最少的方案 件下, ——在其他条件相同的情况下,选费用最少 在其他条件相同的情况下, 在其他条件相同的情况下 的方案
确定抽样组织方式
在实际工作中, 在实际工作中,选择适当的抽样组 织方式主要应考虑: 织方式主要应考虑: 调查对象的性质特点 对调查对象的了解程度( 对调查对象的了解程度(抽样框的特 点) 抽样误差的大小 人力、 人力、财力和物力等条件的限制
确定样本容量
样本容量 指样本中含有的总体单位的 数目,通常用n 来表示。 数目,通常用 来表示。
连续到加油站加油的 汽车总体无法编制抽 样框:时间不定、 样框:时间不定、总量
也无法确定。 也无法确定。
确定抽样方法 重复抽样 抽出 个体 特点 又被称作重置抽样、 又被称作重置抽样、有放回抽样 登记 特征 放回 总体 继续 抽取
同一总体单位有可能被重复抽中, 同一总体单位有可能被重复抽中, 而且每次抽取都是独立进行
按随机原则抽取样本单位 目的是推断总体的数量特征 抽样推断的结果具有一定的可靠程度, 抽样推断的结果具有一定的可靠程度, 抽样误差可以事先计算并控制
抽样估计的应用
不可能进行全面调查时 不必要进行全面调查时 来不及进行全面调查时 对全面调查资料进行补充修正时
抽样调查研究
Sampling Study 为什么要抽样? 为什么要抽样? 1. 涉及破坏受试对象
n n sp = p(1 − p ) = pq n −1 n −1
样本单位是非标志的方差: ⒍ 样本单位是非标志的方差: n n 2 sp = p (1 − p ) = pq n −1 n −1
为σ 的 无偏估计
2 P
第一节 抽样方案的设计
★ 一、抽样估计的意义和一般步骤 ★ 二、抽样方案设计的基本准则 三、抽样方案设计的主要内容
x =
n m

x n
i=1
i
或 x =

x
i=1 m
i
fi

i=1
fi
为自由度 样本单位标志值的标准差: ⒉ 样本单位标志值的标准差:
2 1 n s= ∑ xi − x 或s = n −1 i=1
(
)
1
m i =1
为 σ 的无偏估计
fi −1 i=1 ∑
∑(x − x)
m i
2
fi
样本单位标志值的方差: ⒊ 样本单位标志值的方差:
X =

N
X N
i=1
i
或 X =

m
X
i=1 m
i
fi

i=1
fi
总体单位标志值的标准差: ⒉ 总体单位标志值的标准差:
σ=
1 N
∑ (X
N i =1
i
− X 或σ =
)
2
1

i =1
m
∑ (X
m
fi
i =1
i
−X
)
2
fi
总体单位标志值的方差: ⒊ 总体单位标志值的方差:
1 2 σ = ∑ X i − X 或σ = N i =1
样本统 样本统 样本统 样本统 样本统 计量样本统 计量 计量 样本统 计量 样本统 计量 样本统 计量 样本统 计量 样本统 计量 样本统 计量 样本统 计量 计量 计量 计量
主要样本 统计量
总体未 知参数
比率(成数) 平均数 比率(成数)
平均数的抽样分布
全部可能样本平均数的均值等于总体均值, 全部可能样本平均数的均值等于总体均值, 即: E(x) = X (x = X ) 从非正态总体中抽取的样本平均数当n 从非正态总体中抽取的样本平均数当n足够大 时其分布接近正态分布。 时其分布接近正态分布。 从正态总体中抽取的样本平均数不论容量大 小其分布均为正态分布。 小其分布均为正态分布。 1 样本均值的标准差为总体标准差的 n 。
第八章 抽样推断
★ 第一节 抽样方案的设计
第二节 简单随机抽样的抽样误差的测定 第三节 简单随机抽样的抽样估计
第一节 抽样方案的设计
★ 一、抽样估计的意义和一般步骤
二、抽样方案设计的基本准则 三、抽样方案设计的主要内容
一、抽样估计的意义和一般步骤
㈠ 抽样估计的定义 ㈡ 抽样估计的特点 ㈢ 抽样估计的运用 ㈣ 抽样估计的一般步骤 ㈤ 总体参数与样本指标
C
n N
= N
(N
− 1 )⋯
(N
− n + 1)
第四章 抽样推断
★ ★
第一节 抽样方案的设计 第二节 简单随机抽样的抽样误差的测定 第三节 简单随机抽样的抽样估计
第二节 简单随机抽样的抽样误差的测定
一、抽样分布 二、抽样估计量的优良标准 三、抽样误差的概念 四、抽样平均误差 五、抽样极限误差
样本统计量所有可能值的 抽样分布 概率分布
质量控制
2. 取得精确可靠的结果 3. 实际情况的约束
时间, 时间,成本等
抽样估计的一般步骤
设 计 抽 样 方 案
抽 取 样 本 单 位
收 集 样 本 数 据
计 算 样 本 统 计 量
推 断 总 体 参 数
总体参数
指被估计的总体指标, 指被估计的总体指标,又被 称为全及指标 称为全及指标
设总体中 N 个总体单位某项标志的标志值分别 为 X 1 , X 2 ⋯ , X N ,其中具有某种属性的有 N1个 单位, 个单位, 单位,不具有某种属性的有 N 0个单位,则 总体平均数(又叫总体均值): ⒈ 总体平均数(又叫总体均值):
第一阶段:从该省所有县中抽取 个县 第一阶段:从该省所有县中抽取5个县 第二阶段:从被抽中的5个县中各抽 个县中各抽4个乡 第二阶段:从被抽中的 个县中各抽 个乡 第三阶段:从被抽中的20个乡中各抽 个乡中各抽5个村 第三阶段:从被抽中的 个乡中各抽 个村 第四阶段:从被抽中的100个村中各抽 户 个村中各抽10户 第四阶段:从被抽中的 个村中各抽 样本n=100×10=1000(户) × 样本 户
样本群数r=4 样本群数
P D 样本容量
n = nd + np + nl + nh
简单、方便,能节省人力、物力、 简单、方便,能节省人力、物力、财 力和时间, 力和时间,但其样本代表性可能较差
确定抽样组织方式
5·多阶段抽样 多阶段抽样 —— 指分两个或两个以上的阶段来完成抽 取样本单位的过程 在某省100多万农户抽取 多万农户抽取1000户调查 例:在某省 多万农户抽取 户调查 农户生产性投资情况。 农户生产性投资情况。
σ P = P(1 − P ) = PQ
2
指根据样本单位的标志值计算的用 样本指标 以估计和推断相应总体指标的综合 指标,又被称为估计量或统计量 指标,又被称为估计量或统计量 设样本中 n 个样本单位某项标志的标志值 分别为 x1 , x 2 ⋯ , x n ,其中具有和不具有某 种属性的样本单位数目分别为 n1和 n 个,则 0 样本平均数(又叫样本均值): ⒈ 样本平均数(又叫样本均值):
随机起点 半距起点 对称起点
······
(总体单位按某一标志排序) 总体单位按某一标志排序) 按无关标志排队,其抽样效果相当于简单随机抽样; 按无关标志排队,其抽样效果相当于简单随机抽样; 简单随机抽样 按有关标志排队,其抽样效果相当于类型抽样 类型抽样。 按有关标志排队,其抽样效果相当于类型抽样。
相关主题