试验设计与数据分析.
备
注
正态总体ξ ~(μ 1,σ 正态总体η ~(μ 2,σ 已知σ
1 2 2 2 1 2
(
)
x - y -
2
12
n1
2 2
n2
,
σ
1
σ 2 为总体标准差,
x - y
2
12
n1
2 2
)
n1,n2 为样本容量 μ 为查正态分布表所得
)
σ
back
(x - y - t
2
n 2
n
2
i 1
i
0
i 1
i
0
2
2
2
1-
2
正态总体方 差σ 估计
2
所得
的区间
,
(n -1)s 2 正态总体ξ 2 , ~(μ ,σ 2) ( 2 未知μ
(n -1)s2
n 为样本容量
2
12
)
s 为样本方差 χ
2
为查卡方分布表
所得
back
区间估 计类别
条
件
置信区间 计算公式
备
注
正态总体ξ ~(μ 1,σ 正态总体η ~(μ 2,σ 已知
试验设计与数据分析
2008年2月修订 版本4.0
qblin@
结束
• HOW WE TEACH IS ALSO WHAT WE TEACH,
HOW WE LEARN IS ALSO WHAT WE LEARN.
• 我们教育的方式本身也是我们教育的内容;
我们学习的方式本身也是我们学习的内容。
现在请计算以上例题
2 2 ) 2 1 )
x
{
i 1 n2 2 j 1
n1
i
- 1 / n1
2 2
σ
1
σ 2 为总体标准差,
F y j - 2 / n2
,
n1,n2 为样本容量 F 为查 F(n1,n2)分布表所得数据
x
i 1
n1
i
- 1 / n1
2 j
F
1-
2 j 1
• 作区间估计时,通常计算两尾概率,即区间内的概率为
置信度1- ,区间外两边的概率各为显著水准 之半。
区间估计的种类
对正态总体均值的区间估计
• 已知总体标准差(正态分布) • 未知总体标准差(t分布)
对两个正态总体均值差的区间估计
• 已知两个总体标准差(正态分布) • 未知两个总体标准差,假设 1 = 2 (t分布) • 未知两个总体标准差,假设 1 = 2 (t分布)
)
其中 SW=
2 n1 s12 n 2 s 2 n1 n 2 - 2
back
区间估计类 别
条
件
置信区间 计算公式
备 注
μ 0 为总体平均值 正态总体ξ x - x x - x n 为样本容量 ~(μ ,σ 2) ( , ) 2 χ 为查卡方分布表 已知μ =μ 0
两个正态总体 均值差的区间 正态总体ξ 估计
~(μ 1,σ 正态总体η ~(μ 2,σ 未知σ 1,σ 假设 σ 1= σ
2 2 2 2 1 2
SW
1 1 n1 n 2 1 1 n1 n 2
, σ )
1
σ 2 为总体标准差,
)
x - y t SW
2
n1,n2 为样本容量 t 为查 t 分布表所得
目
• 第一章 绪论 • 第二章 常用统计分布 • 第三章 参数估计 • 第四章 假设检验
录
• 第七章 试验设计 • 第八章 非参数统计分析 • 第九章 主成分分析和因子分析 • 第十章 科技绘图
• 第五章 方差分析
• 第六章 回归分析
• 第十一章 常用统计软件
第三章 参数估计
3.1 抽样分布
3.2 区间估计
3.2 参数区间估计
抽样分布与区间估计
• 前面讨论了总体分布和抽样分布。 • 利用抽样分布,可以指在原总体的分布为已知的
情况下,用一定的概率保证计算出某个样本统计 量出现的区间范围。
• 下面,我们将这个问题反过来讨论。即,利用样本
数据,以抽样总体的分布为理论基础,用一定的概 率保证来计算出原总体中未知参数的区间范围。即 区间估计。
y
n2
- 2 / n2
2
}
两个正态总体 μ 1 及μ 估计
2
方差比的区间 正态总体ξ
~(μ 1,σ 正态总体η ~(μ 2,σ 未知 μ
1 2 2 ) 2 1 )
s1 s2 为总体标准差,
s12 (F s22
2
,
s12 F
1-
2
2 s2
)
F 为查 F(n1,n2)分布表所得数据
back
( x - ,x n n
-0 --
0
)
2
n 为样本容量
2 丂
为查正态分布表所
得
back
未知σ 正态总体 ξ ~(μ ,σ 2) (x -
S 为样本标准差
s n t
2
,x +
-
s n
t
2
)
n 为样本容量
t
2
为查 t 分布表得
back
区间估 计类别
条
件
置信区间 计算公式
2
及μ
特别说明
•以上置信区间计算的前提是:
数据连续且总体服从正态分布
•计算前应对样本数据进行正态性检验,确认是否服 从正态分布
•非正态分布数据的置信区间比较难算,另有办法
对正态总体均值的区间估计
估计均值, 已知
例 已知某品种玉米的单株产量X服从正态分布N(, 2),其 中 未知, =5 g。现从该总体随机抽取一个大小为n= 25的样本,算得样本平均数为35。问该品种玉米的单株产 量(即总体平均数 )有95%的可能落在什么区间? 当要计算95%估计区间时,两尾概率之和为 =1-95%=0.05, 单尾概率为 2 =0.025,查标准正态分布的两尾概率表,或 单尾概率表,查得的值为1.96。对应于=1-90%=0.10的 =1-99%=0.01的值为2.58。大部分科学试验 值为1.64。 中最常用的显著水准就是这三个。所以1.64, 1.96和2.58这 三个值应该用心记住。
置信概率与置信区间
• 所谓置信度就是表示人们所作判断的可靠把握的程度。
置信度有两重含义,一是置信概率,一是置信区间。
• 在日常生活中,人们的判断若有90%或95%的把握性,
就认为这种判断基本上是正确的。在化学实验中作统 计推断时,通常取95%的置信度,也采取90%、99% 等数值,或按研究目的来另行决定。
区间估计的种类
对正态总体方差 2的区间估计(卡方分布)
• 已知总体均值 • 未知总体均值
对两个正态总体方差比的区间估计(F分布)
• 已知两个总体均值 • 未知两个总体均值
区间估 计类别
条 件 已知σ =σ
置信区间 计算公式
0
备 注 σ 0 为总体标准差
2
正态总 体均值μ 的 区间估计
正态总体 ξ ~(μ ,σ 2)