当前位置:文档之家› 数理统计--参数估计、假设检验、方差分析(李志强) (3)汇总

数理统计--参数估计、假设检验、方差分析(李志强) (3)汇总

教学单元案例: 参数估计与假设检验北京化工大学 李志强教学内容:统计量、抽样分布及其基本性质、点估计、区间估计、假设检验、方差分析 教学目的:统计概念及统计推断方法的引入和应用(1)理解总体、样本和统计量等基本概念;了解常用的抽样分布;(2)熟练掌握矩估计和极大似然估计等方法; (3)掌握求区间估计的基本方法; (4)掌握进行假设检验的基本方法; (5) 掌握进行方差分析的基本方法;(6)了解求区间估计、假设检验和方差分析的MA TLAB 命令。

教学难点:区间估计、假设检验、方差分析的性质和求法 教学时间:150分钟教学对象:大一各专业皆可用一、统计问题 引例例1 已知小麦亩产服从正态分布,传统小麦品种平均亩产800斤,现有新品种产量未知,试种10块,每块一亩,产量为:775,816,834,836,858,863,873,877,885,901问:新产品亩产是否超过了800斤?例2 设有一组来自正态总体),(2σμN 的样本0.497, 0.506, 0.518, 0.524, 0.488, 0.510, 0.510, 0.512. (i) 已知2σ=0.012,求μ的95%置信区间; (ii) 未知2σ,求μ的95%置信区间; (iii)求2σ的95%置信区间。

例3现有某型号的电池三批, 分别为甲乙丙3个厂生产的, 为评比其质量, 各随机抽取5只电池进行寿命测试, 数据如下表示, 这里假设第i 种电池的寿命),(.~2σμi i N X .(1) 试在检验水平下,检验电池的平均寿命有无显著差异? (2) 利用区间估计或假设检验比较哪个寿命最短.二 统计的基本概念: 总体、个体和样本(1)总体与样本总体 在数理统计中,我们将研究对象的某项数量指标的值的全体称为总体,总体中的每个元素称为个体比如,对电子元件我们主要关心的是其使用寿命.而该厂生产的所有电子元件的使用寿命取值的全体,就构成了研究对象的全体,即总体,显然它是一个随机变量,常用X 表示 为方便起见,今后我们把总体与随机变量X 等同起来看,即总体就是某随机变量X 可能取值的全体.它客观上存在一个分布,但我们对其分布一无所知,或部分未知,正因为如此,才有必要对总体进行研究.简单随机样本对总体进行研究,首先需要获取总体的有关信息. 一般采用两种方法:一是全面调查.如人口普查,该方法常要消耗大量的人力、物力、财力.有时甚至是不可能的,如测试某厂生产的所有电子元件的使用寿命. 二是抽样调查. 抽样调查是按照一定的方法,从总体X 中抽取n 个个体.这是我们对总体掌握的信息.数理统计就是要利用这一信息,对总体进行分析、估计、推断.因此,要求抽取的这n 个个体应具有很好的代表性.按机会均等的原则随机地从客观存在的总体中抽取一些个体进行观察或测试的过程称为随机抽样.从总体中抽出的部分个体,叫做总体的一个样本.从总体中抽取样本时,不仅要求每一个个体被抽到的机会均等,同时还要求每次的抽取是独立的,即每次抽样的结果不影响其他各次的抽样结果,同时也不受其他各次抽样结果的影响.这种抽样方法称为简单随机抽样.由简单随机抽样得到的样本叫做简单随机样本.往后如不作特别说明,提到“样本”总是指简单随机样本.从总体X 中抽取一个个体,就是对随机变量X 进行一次试验.抽取n 个个体就是对随机变量X 进行n 次试验,分别记为X1,X2,…,Xn.则样本就是n 维随机变量(X1,X2,…,Xn).在一次抽样以后, (X1,X2,…,Xn)就有了一组确定的值(x1,x2,…,xn),称为样本观测值.样本观测值(x1,x2,…,xn)可以看着一个随机试验的一个结果,它的一切可能结果的全体构成一个样本空间,称为子样空间.(2)样本函数与统计量设n x x x ,,,21 为总体的一个样本,称ϕϕ= (n x x x ,,,21 )为样本函数,其中ϕ为一个连续函数。

如果ϕ中不包含任何未知参数,则称ϕ(n x x x ,,,21 )为一个统计量。

2、统计量(1)常用统计量样本均值.11∑==ni i x n x样本方差∑=--=ni ix x n S 122.)(11 (与概率论中的方差定义不同)样本标准差.)(1112∑=--=ni i x x n S 样本k 阶原点矩∑===n i ki k k x n M 1.,2,1,1样本k 阶中心矩∑==-='ni k i kk x x n M 1.,3,2,)(1 (二阶中心矩∑=-=n i i X X n S 122)(1*与概率论中的方差定义相同)例6.2:用测温仪对一物体的温度测量5次,其结果为(℃):1250,1265,1245,1260,1275,求统计计量X ,S 2和S 的观察值.,,2s s x 和(2)统计量的期望和方差μ=)(X E ,nX D 2)(σ=,22)(σ=S E ,221)*(σnn S E -=, 其中∑=-=n i i X X n S 122)(1*,为二阶中心矩。

)(~,,,21x F X X X n ,i.i.d ,独立同分布。

无限总体抽样。

(3) 随机数生成在Matlab 中各种随机数可以认为是独立同分布的,即简单随机样本。

以下罗列在Matlab 中的实现方法。

)1,0U(~,,,21n X X X ,均匀分布样本n=10;x=rand(1,n)),U(~,,,21b a X X X nn=10;a=-1;b=3;x=rand(1,n);x=(b-a)*x+a)1,0N(~,,,21n X X X ,正态分布样本n=10;x=randn(1,n)),N(~,,,221b a X X X nmu=80.2;sigma=7.6;m=1;n=10; x=normrnd(mu,sigma,m,n)上面首先对总体均值赋值mu=80.2;再对标准差赋值sigma=7.6; m=1;n=10;分别对生成的随机阵对的行数和列数进行赋值,然后可直接利用Matlab 自带的函数normrnd 生成正态分布的随机数。

类似地可生成m 行n 列的随机矩阵,服从指定的分布。

生成随机数的函数后缀都是rnd ,前缀为分布的名称。

常用分布的随机数产生方法罗列如下,注意使用前先要对参数赋值。

x=betarnd(a,b,m,n) 参数为a,b 的beta 分布; x=binornd(N,p,m,n) 参数为N,p 的二项分布; x=chi2rnd(N,m,n) 自由度为N 的2χ分布; x=exprnd(mu,m,n) 总体期望为mu 的指数分布; x=frnd(n1,n2,m,n) 自由度为n1与n2的F 分布; x=gamrnd(a,b,m,n) 参数为a,b 的Γ分布;x=lognrnd(mu,sigma,m,n) 参数为mu 与sigma 的对数正态分布; x=poissrnd(mu,m,n) 总体均值为mu 的Poisson 分布; x=trnd(N,m,n) 自由度为N 的T 分布; Matlab 统计工具箱中还有一些其它分布,不再一一列举。

3、三个抽样分布(χ2、t 、F 分布)1.3 三个常用分布以下罗列出数理统计中三个重要分布的概念与性质。

1.3.1 2χ分布定义1.2 设一维连续型随机变量X 的密度函数为⎪⎩⎪⎨⎧≤>Γ=--0,00,e )2/(21)(2122/x x x n x f x n n n (1-2)则称X 服从自由度为n 的2χ分布,记为)(~2n X χ。

05101520253035400.020.040.060.080.10.120.14图1-2 2χ分布密度函数示意图(1)期望与方差:n X =E ,n X 2=D(2)来源:若)1,0N(~,,,21n X X X 独立同分布,则)(~222221n X X X n χ+++(3)可加性:若)(~121n Y χ,)(~222n Y χ,且两者独立,则有)(~21221n n Y Y ++χ(4)重要结论:若),N(~,,,221σμn X X X ,则)1(~)()1(221222--=-∑=n X XS n ni iχσσ以下给出了自由度为5,10,20的2χ分布的密度函数,如图1-2所示。

1.3.2 t 分布定义1.3 设一维连续型随机变量X 的密度函数为2121)2()21()(+-⎪⎪⎭⎫ ⎝⎛+Γ+Γ=n n n x n nn x f π (1-3)则称X 服从自由度为n 的t 分布,记为)(~n t X 。

-3-2-1012300.050.10.150.20.250.30.350.4图1-3 t 分布密度函数与标准正态分布密度函数(1)密度函数特点:与标准正态分布类似,方差较大。

∞→n 时,22e21)(x n x f -=→πϕ(标准正态分布密度函数)(2)来源:设)1,0N(~X ,)(~2n Y χ,且两者独立,则)(~/n t nY X(3)重要结论:设),N(~,,,221σμn X X X ,则)1(~/--=n t nS X T μ1.3.3 F 分布定义1.4 设一维连续型随机变量X 的密度函数为⎪⎪⎩⎪⎪⎨⎧≤>⎪⎪⎭⎫ ⎝⎛+=+--0,00,1)(22112211x x x n n cx x f n n n (1-4) 其中常数22121211)2()2()2(nnn n n n n c ⎪⎪⎭⎫ ⎝⎛ΓΓ+Γ= 则称X 服从第一自由度1n ,第二自由度2n 的F 分布,记为),(~21n n F X 。

(1)密度函数特点:在1=x 附近密度函数取值较大,为单峰非对称的。

当两个自由度都很大时,X 取值以较大概率集中在1=x 附近。

以下画出了)12,8(F 的密度函数00.51 1.52 2.53图1-4 F 分布密度函数(2)来源:设)(~12n X χ,)(~22n Y χ,且两者独立,则),(~//2121n n F n Y n X F =(3)重要结论:设1,,21n X X X 为来自总体),(211σμN 的简单随机样本,2,,,21n Y Y Y 为来自总体),(222σμN 的简单随机样本,且两者独立。

又设两个样本方差分别为21S 与22S ,则)1,1(~//2122212221--=n n F S S F σσ三、点估计的两种方法(1)矩法所谓矩法就是利用样本各阶原点矩代替相应的总体矩,来建立估计量应满足的方程,从而求得未知参数估计量的方法。

设总体X 的分布中包含有未知数m θθθ,,,21 ,则其分布函数可以表成).,,,;(21m x F θθθ 显示它的k 阶原点矩),,2,1)((m k X E v k k ==中也包含了未知参数m θθθ,,,21 ,即),,,(21m k k v v θθθ =。

相关主题