当前位置:文档之家› 数理统计中的几种统计推断方法

数理统计中的几种统计推断方法

数理统计中的几种统计推断方法——导学文章之九数理统计的基本问题是根据样本所提供的信息,对总体的分布以及分布的数字特征作出统计推断。

统计推断的主要内容分为两大类:一是参数估计问题,另一类是假设检验问题。

本篇文章主要讨论总体参数的点估计、区间估计和假设检验。

一、点估计1、矩估计首先讲“矩”的概念,定义:设X 是随机变量,k 是一正整数,若k EX 存在,则称k EX 为随机变量X 的k 阶原点矩,记为k a ;若存在,则称它为X 的k 阶中心矩,记为k b 。

显然,数学期望EX 就是1阶原点矩,方差DX 就是2阶中心矩。

简单的说就是用样本矩去估计相应的总体矩,用样本矩的连续函数去估计相应的总体矩的连续函数。

矩估计法的理论基础是大数定理。

因为大数定理告诉我们样本矩依概率收敛于总体的相应矩,样本矩的连续函数依概率收敛于相应总体矩的连续函数。

我们通常样本的均值X 去估计总体的均值E X :即总体为X 时,我们从中取出n 个样本12,,n X X X ,我们认为总体的均值就是11nii X X n==∑,(当然这只是对总体均值的一种估计,当然会有误差)当2EX 存在的时候,我们通常用211nii X n=∑作为总体X 的2EX 的估计一般地,我们用11nkii X n=∑作为总体X 的kEX 的估计,用11()nkii X X n=-∑作为总体的()kE X EX -的估计。

例:设总体X 在[,]a b 上服从均匀分布,参数,a b 未知,12,,n X X X 是一个样本,求,a b 的矩估计量。

解:由矩估计法知道:2a b EX +=由于22()DX EX EX =-,因此2222()()()124b a a b EX D X EX -+=+=+用矩估计法,也即用11nii X X n==∑作为E X 的估计,用211nii X n=∑作为2EX 的估计,为了计算方便,我们记111nii A X n==∑,记2211nii A X n==∑,即有12a b A +=,2222()()124b a a b EXA -+=+=解得,12a b A b a +=⎧⎪⎨-=⎪⎩再联立解关于,a b 的方程组得,a b 的矩估计量分别为1a A X =-=-1b A X =+=+2、极大似然估计⑴ 对于连续型总体X ,设它的密度函数为12(;,,)m f x θθθ ,其中12,,m θθθ 是需要估计的未知参数。

设12,,n X X X 是来自总体X 的一个样本,则12,,n X X X 的联合密度函数为:121(;,,)ni m i f x θθθ=∏对于给定的一组样本值12,,n x x x ,记联合密度1212121(,,;,,)(;,,)nn m i m i L L x x x f x θθθθθθ===∏则称L 为样本的似然函数⑵ 若X 为离散型总体,它的概率分布为: 12{}(;,,)m P X x p x θθθ==对于给定的一组样本观测值12,,n x x x ,记联合密度1212121(,,;,,)(;,,)nn m i m i L L x x x p x θθθθθθ===∏则称L 为样本的似然函数 ⑶ 具体求法对于已经给定的样本观测值12,,n x x x 来说,似然函数L 是关于待估计的参数12,,m θθθ 的函数,因此我们应该想办法通过似然函数L 求出参数12,,m θθθ 值。

这里我们求法的思想来源于多元函数求极大值:也即,我们把1212(,,;,,)n m L L x x x θθθ= 看作关于12,,m θθθ 的多元函数,我们要求得适当的12,,m θθθ 的值,使得1212(,,;,,)n m L L x x x θθθ= 取最大值。

解释:实际上1212(,,;,,)n m L L x x x θθθ= 表示随机变量12,,n X X X 取得样本值12,,n x x x 时的联合概率,我们在一次试验中事件1212(,,)(,,)n n X X X x x x = 已经发生,我们就有理由认为,参数必须保证此时的概率最大,也即:参数12(,,)m θθθ 的值应该是使得1212(,,;,,)n m L L x x x θθθ= 最大的点。

这样我们的方法就是多元函数求极大值的方法。

极大似然估计的具体步骤为:① 求出似然函数1212(,,;,,)n m L L x x x θθθ= ;② 计算关于12(,,)m θθθ 的函数1212(,,;,,)n m L L x x x θθθ= 的极大值点, 我们由微积分的知识知道,实际问题中的极大值点就是函数的驻点,也就是每个偏导数都为0的点,即12000nLLLθθθ∂⎧=⎪∂⎪∂⎪=⎪∂⎨⎪⎪∂⎪=⎪∂⎩ (一般称该方程组为似然方程组)但是在实际计算中,由于1212(,,;,,)n m L L x x x θθθ= 都是乘积,因此以上方程组求解不太容易,这时候我们由微积分的知识知道到函数1212(,,;,,)n m L L x x x θθθ= 和它的对数函数1212ln ln (,,;,,)n m L L x x x θθθ= 有相同的极大值点,因此我把问题转化为求1212ln ln (,,;,,)n m L L x x x θθθ= 的极大值点,这样把乘积问题转化为了和差问题,在某些复杂问题中可以大大减轻计算!12ln 0ln 0ln 0m L LLθθθ∂⎧=⎪∂⎪∂⎪=⎪∂⎨⎪⎪∂⎪=⎪∂⎩(一般称该方程组为对数似然方程组)求解这个方程组即得到③ 上个步骤求出的 12(,,)mθθθ 就是参数12(,,)m θθθ 的估计值。

二、区间估计由于总体的未知参数θ的估计量 12(,,)nX X X θ 是随机变量,无论这个估计量的性质有多好,通过一个样本值12(,,)n x x x 所得到的估计值,只能是未知参数θ的近似值,而不是θ的真值。

并且样本值不同所得到的估计值也不同。

那么θ的真值在什么范围内呢?能不能通过样本,寻找一个区间,以一定的把握包含总体未知参数θ呢?这就是总体未知参数的区间估计问题。

区间估计严格的定义为: 定义:设总体X 的分布函数(,)F x θ含有一个未知参数θ,对于给定值α(01)α<<,若由样本12(,,)n X X X 确定的两个的两个统计量 112(,,)n X X X θ 和 12(,,)n X X X θ 满足 121212{(,,)(,,)}1n nP X X X X X X θθθα<<=- 则称随机区间 12(,)θθ是参数θ的置信度为1α-的置信区间, 12θθ和分别趁称为置信度为1α-的双侧置信区间的置信下限和置信上限,1α-称为置信度。

单个正态总体的的数学期望和方差的区间估计是我们重点要求掌握的知识点,大家可以好好阅读教材第189—198面,实际上课本把这种区间估计分各种情形的结论总结成了第209面的表格。

大家在理解这些区间估计的实质后,应该把表格的结论和公式记住,往往在实际解题的时候我们只需要套用这些结论就可以了! 三、假设检验所谓假设检验,顾名思义就是先假设再检验,实际上有点类似于反证法,在实际问题中我们往往需要对未知总体提出某中假设或推断,但是我们的假设可能是错的,也可能是正确的,这时候我们就需要利用一个抽样的样本12(,,)n x x x ,通过一定的方法,检验这个假设是否合理,从而作出接受或者拒绝这个假设的结论。

假设检验的基本原理是——小概率事件原理,也即:我们认为小概率事件在一次试验中几乎不可能发生,如果我们在抽取的样本观测值12(,,)n x x x 下,居然使得小概率事件发生了,我们就有理由否定原假设。

在明确一个假设检验问题的性质与基本前提(包括分布类型是否已知,如果类型已知,分布中包含哪些未知参数等等)之后,假设检验的一般步骤如下:⑴ 充分考虑和利用已知的背景知识提出原假设0H 以及对立假设1H ;⑵ 给定样本,确定合适的检验统计量,并在0H 为真下导出统计量的分布(要求此分布不依赖与任何未知参数);⑶ 确定拒绝域:即依直观分析先确定拒绝域的形式,然后根据给定的显著性水平α和以上统计量的分布由条件概率00{|}P H H α=拒绝为真确定拒绝域的临界值,从而确定拒绝域;⑷ 作出判断:由一次具体抽样的样本值计算统计量的值,若统计量的值落入以上拒绝域,则拒绝0H ;否则接受0H 。

我们重点研究单个正态总体数学期望和方差的假设,两个正态总体均值差和方差比的假设检验,教材分别给出了每种不同类型所用的统计量以及基本步骤(见教材第221—250面)。

对不同类型的问题,大家现在应该模仿教材的解法套出一些题目。

在实际解题的时候我们需要注意以下问题: ① 不同类型所用的统计量;② 用到的统计量中的自由度,以便于查表。

相关主题