当前位置:文档之家› MINITAB统计基础

MINITAB统计基础

MINITAB统计基础1.正态总体的抽样分布1)样本均值的分布——标准正态分布及T分布样本标准差计算公式:◆T分布的定义:Student t distribution,如果X服从标准正态分布,S2服从个自由度的卡方分布,且它们相互独立,那么随机量所服从的分布称为个自由度的t分布。

其分布密度函数为:当时的极限分布即是标准正态分布,当时就是Cauchy分布。

T分布只包含1个参数。

数学期望和方差分别为0,(时期望不存在,方差不存在)。

我们常常用表示υ个自由度的t分布。

MINITAB对于更一般的t分布还增加了一个“非中心参数”,当非中心参数为0时,就得到了我们现在所说的t分布。

在用MINITAB计算时,只要注意这一点就行了。

自由度:可以简单理解为在研究问题中,可以自由独立取值的数据或变量的个数。

范例:✧Z~N(0,1),求Z=1.98时的概率密度。

计算----->概率分布----->正态分布----->概率密度----->输入常数1.98----->确定概率密度函数正态分布,均值 = 0 和标准差 = 1x f( x )1.980.0561831✧。

计算----->概率分布----->正态分布----->累积概率----->输入常数2.4----->确定累积分布函数正态分布,均值 = 0 和标准差 = 1x P( X <= x )2.4 0.991802✧Z~N(0,1),求使得P(Z<x)=0.95成立的x值,即Z的0.95分位数。

计算----->概率分布----->正态分布----->逆累积概率----->输入常数0.95----->确定逆累积分布函数正态分布,均值 = 0 和标准差 = 1P( X <= x ) x0.95 1.64485✧自由度=12,求使得。

计算----->概率分布----->t分布----->逆累积概率----->输入自由度12----->输入常数0.95----->确定逆累积分布函数学生 t 分布,12 自由度P( X <= x ) x0.95 1.7822✧自由度=12,求使得。

计算----->概率分布----->t分布----->累积概率----->输入自由度12----->输入常数3----->确定累积分布函数学生 t 分布,12 自由度x P( X <= x )3 0.9944672)双样本均值差的分布3)正态样本正态样本方差S2的分布——卡房卡方分布若X1,X2,……,Xn是从正态总体中抽出的一组样本量为n的独立随机样本,记已知时:当未知时,用替后可以得到其概率密度函数在正半轴上呈正偏态分布。

◆卡方分布的定义:把n个相互独立的标准正态随机变量的平方和称为自由度为n的卡方分布。

它的密度表达式为:参数称为自由度。

卡方分布有向右的偏斜,特别在较小自由度情况下(越小,分布越偏斜)。

我们常用表达自由度为的卡方分布。

卡方分布有很多用途,其中一项就是用来分析单个正态总体样本方差的状况;还可以用来进行分布的拟合优度检验,即检验资料是否符合某种特定分布;对于离散数据构成的列联表,也可以用来分析两个离散型因子间是否独立等。

◆卡方分布的性质a)卡方分布的加法性:设X和Y彼此独立,且都服从卡方分布,其自由度分别为n1,n2。

若令Z=X+Y,则Z服从自由度为n1+n2的卡方分布。

b)若X,则,。

计算下列各卡方分布的相关数值:✧自由度=10,求使得成立的x 值。

计算-----> 概率分布-----> 卡方分布-----> 逆累积概率-----> 自由度=10 -----> 常数=0.95 -----> 确定逆累积分布函数卡方分布,10 自由度P( X <= x ) x0.95 18.307✧自由度=10,求。

计算-----> 概率分布-----> 卡方分布-----> 累积概率-----> 自由度=10 -----> 常数=28 -----> 确定累积分布函数卡方分布,10 自由度x P( X <= x )28 0.9981954)两个独立的正态样本方差之比的分布——F分布两个独立的正态样本方差之比的分布是F分布。

设有两个独立的正态总体() 和() ,它们的方差相等。

又设X1,X2,…,X n是来自()的一个样本Y1,Y2,…,Y n是来自() 的一个样本,这两样相互独立。

它们的样本方差之比是自由度为n-1和m-1的F分布:n-1称为分子自由度;m-1为分母自由度;F分布的概率密度函数在正半轴上呈正偏态分布。

实际上,F统计量就是由两个卡方随机变量相除所构成的,如果,,且二者相互独立,则称二者比值的分布为F分布,即其密度函数是:F分布的应用非常广泛,尤其是在判断两正态总体方差是否相等以及方差分析(ANOVA)等问题上面。

✧计算F0.95(8,,18)的数值。

计算-----> 概率分布-----> F分布-----> 逆累积概率-----> 分子自由度=8 -----> 分母自由度=18 ----->常数=0.95 ----->确定逆累积分布函数F 分布,8 分子自由度和 18 分母自由度P( X <= x ) x0.95 2.510162.参数的点估计1)点估计的概念用单个数值对于总体参数给出估计的方法称为点估计。

设Ɵ是总体的一个未知参数,X1,X2,…,X n是从总体中抽取的样本量为n的一个随机样本,那么用来估计未知参数Ɵ的统计量(X1,X2,…X n)称为Ɵ的估计量,或称为Ɵ的点估计。

我们总是在参数上方画一个帽子“∧”表示该参数的估计量。

在工程中经常出现的点估计问题之最好结果是:➢对于总体均值,;➢对于总体方差,;➢对于比率p ,,X是样本量为n的随机样本中我们感兴趣的那类出现的次数;➢对于 1 - 2 ,=(两个独立随机样本均值之差);➢对于p1 - p2,估计为(两个独立随机样本比率之差);2)点估计的评选标准3.参数的区间估计设Ɵ是总体的一个待估参数,从总体中获得样本量为n 的样本是X1,X2,…,X n,对给定的显著性水平α(0﹤α﹤1),有统计量:ƟL= ƟL(X1,X2,…,X n)与ƟU= ƟU(X1,X2,…,X n),若对于任意Ɵ有P(ƟL≤Ɵ≤ƟU)= 1 - α,则称随机区间[ƟL,ƟU]是Ɵ的置信水平为1-α的置信区间,ƟL与ƟU分别称为置信下限和置信上限。

置信区间的大小表达了区间估计的精确性,置信水平表达了区间估计的可靠性, 1 - α是区间估计的可靠程度,而α表达了区间估计的不可靠程度。

在进行区间估计时,必须同时考虑置信水平与置信区间两个方面。

对于置信区间的选取,一定要注意,决不能认为置信水平越大的置信区间就越好。

实际上,置信水平定的越大,则置信区间相应也一定越宽,当置信水平太大时,则置信区间会宽得没有实际意义了。

这两者要结合在一起考虑,才更为实际。

通常我们取置信水平为0.95,极个别情况下可取0.99或0.90,一般不取其他的置信水平。

1)单正态总体均值的置信区间当时,正态总体均值的置信区间有以下三种情况:a)当总体方差已知时,正态总体均值的1 –α置信区间为:式中,是标准正态分布的分位数,也就是双侧α分位数。

例如α=0.05时,。

在MINITAB中,我们通过:统计-----> 基本统计量-----> 单样本Z来实现的。

由于实际情况中,已知标准差的情况很少见,因此我们这里重点关注的是标准差位置时的情况。

b)当总体方差未知时,用样本标准差S代替,此时正态总体均值的1 –α置信区间为:式中,表示自由度为n – 1的t 分布的分位数,也就是t分布的双侧α分位数。

例如α=0.05时,样本量n = 16时,,其值略大于。

在MINITAB中,我们通过:统计-----> 基本统计量-----> 单样本t 来实现的。

✧某集团公司正推进节省运输费用活动,下表为20个月使用的运输费用调查结果数据:1742 1827 1681 1742 1676 1680 1792 1735 1687 18521861 1778 1747 1678 1754 1799 1697 1664 1804 1707假设运输费用是服从正态分布的,求运输费用均值的95%置信区间。

统计-----> 基本统计量-----> 单样本t -----> 样本所在列= 运输费用-----> 选项-----> 置信水平=95 -----> 确定。

单样本 T: 运输费用均值标变量 N 均值标准差准误 95% 置信区间运输费用 20 1745.2 61.9 13.8 (1716.2, 1774.2)c)前两种情况讨论的是当总体为正态分布时,的区间估计,然而当总体不是正态分布时,如果样本量n 超过30,则可根据中心极限定理知道:仍近似服从正态分布,因而仍可用正态分布总提示的均值的区间估计方法,而且可以直接用样本标准差代替总体标准差,即采用公式:在MINITAB中,通常直接采用:统计-----> 基本统计量-----> 图形化汇总中得到总体均值的置信区间结果。

只不过要注意的是:总体非正态时,在小样本情况下此结果并不可信,只有当样本量超过30后,由于中心极限定理的保证,此结果才是可信的。

2)单正态总体方差和标准差的置信区间当时,正态总体方差的置信区间是:式中,和分别是分位数与分位数。

当时,正态总体标准差的置信区间是:✧1742 1827 1681 1742 1676 1680 1792 1735 1687 18521861 1778 1747 1678 1754 1799 1697 1664 1804 1707统计-----> 基本统计量-----> 单方差-----> 样本所在列= 运输费用-----> 选项-----> 置信水平=95 -----> 确定。

单方差检验和置信区间: 运输费用方法卡方方法仅适用于正态分布。

Bonett 方法适用于任何连续分布。

统计量变量 N 标准差方差运输费用 20 61.9 383095% 置信区间标准差置信方差置信区变量方法区间间运输费用卡方 (47.1, 90.4) (2215, 8170)Bonett (49.0, 86.6) (2401, 7507)求总体标准差置信区间另一种方法:统计----->基本统计量----->图形化汇总----->变量:运输费用----->置信水平:95 ----->确定3)单总体比率的置信区间当时,也就是X取“非0则1”的0-1分布,我们常需要估计总体中感觉的那类比率的置信区间,比如,一批产品中,不合格品率的大致范围;顾客满意度调查中,有抱怨顾客的比率范围等。

相关主题