几个抽样分布的性质及其应用重庆师范大学涉外商贸学院数学与应用数学(师范)2008级阮国勇指导老师陈勇摘要在概率论中,我们是在随机变量的分布是假设已知的前提下去研究的;而数理统计中,随机变量的分布是未知或不完全知道。
我们通过对随机变量进行重复独立观察得到许多观察值,并对观察值的数据进行分析,从而对所研究的随机变量的分布做出推断。
本文介绍三种重要的抽样分布及其性质,并给出了抽样分布在参数估计、假设检验、分布拟合检验的简单应用。
χ分布;t分布;F分布关键词抽样分布;2Abstract In the theory of probability, we are in the distribution of random variable is assumed known base on the research, however,in the mathematical statistics, random variable distribution is unknown or incompletely known. we base on the random variables are independent observations are repeated many observed value, and the observation data analysis, to study the distribution of random variable to make inference. This paper introduces three kinds of important sampling distribution and its properties, and gives the sampling distribution in parameter estimation, hypothesis testing, fitting of distribution of the simple application.Key words sampling distribution, 2χdistribution, t distribution, F distribution第 1 页共 13 页目录1 引言 (4)2 几个有关概念2.1 总体、个体 (4)2.2 简单随机抽样 (4)2.3 统计量 (5)2.3.1 统计量的定义 (5)2.3.2 常用统计量 (5)2.4 自由度 (5)2.5 抽样分布 (6)3 常用抽样分布及其性质χ分布 (6)3.1 2χ分布的定义 (6)3.1.1 2χ分布的性质 (6)3.1.2 23.2 t分布 (7)3.2.1 t分布的定义 (7)3.2.2 t分布的性质 (7)3.3 F分布 (7)3.3.1 F分布的定义 (7)3.3.2 F分布的性质 (7)4 几个常用抽样分布的应用χ分布的应用 (8)4.1 2χ分布在参数估计中的应用 (8)4.1.1 2χ分布在假设检验中的应用 (8)4.1.2 2χ分布在分布拟合检验中的应用 (8)4.1.3 24.2 t分布的应用 (9)4.2.1 t分布在参数估计中的应用 (9)4.2.2 t分布在假设检验中的应用 (9)4.3 F分布的应用 (10)4.3.1 F分布在参数估计中的应用 (10)4.3.2 F分布在假设检验中的应用 (11)5 总结 (11)6 致谢 (12)7 参考文献 (13)1 引言数理统计中的统计估计与推断需要我们进行抽样估计,样本是统计估计和推断的依据,然而,在处理具体的理论与应用问题时,却很少直接利用样本,而利用他们经过适当处理导出来的量,这个量即统计量,统计量的分布称为抽样分布,三大分布都是在正态分布产生的,他们是正态总体统计估计和校验的基础。
我们研究抽样分布问题中会遇到这些问题:总体的分布类型已知,但总体中的一个或多个参数未知;总体的分布类型只知其形式,但不知总体中的参数;总体的分布类型完全未知,总体中的参数也未知。
本文对于这些问题我们用三大抽样分布有关知识去解决。
2 几个有关概念2.1 总体、个体在数理统计学中,我们把试验的全部可能的观察值称为总体;而把每一个可能观察值称为个体。
总体所含个体的数量称为容量,容量为有限的称为有限容量,容量为无限的称为无限容量。
例如:在研究某批灯泡的平均寿命时,该批灯泡的全体就组成了总体,而其中每个灯泡就是个体;在研究重庆师范大学涉外商贸学院男大学生的身高和体重的分布情况时,该校的全体男大学生组成了总体,而每个男大学生就是个体。
2.2 简单随机样本设(n X X X ,,,21 )是来自总体X 的容量为n 的样本,若n X X X ,,,21 相互独立且与总体X 具有相同的概率分布,我们称(n X X X ,,,21 )为总体X 的一个简单随机样本。
获取简单随机样本的方法称为简单随机抽样。
具体的说,所谓简单随机抽样是指在抽样试验中,每个个体被抽到的机会是均等的,并且每次抽取后,总体的成分保持不变。
2.3 统计量2.3.1 统计量定义设(n X X X ,,,21 )是来自总体X 的一个样本,g (n X X X ,,,21 )是n X X X ,,,21 的函数,若g 为实值函数,且g 中不含任何未知参数,则称g (n X X X ,,,21 )是一个统计量。
2.3.2 常用统计量设(n X X X ,,,21 )是来自总体X 的一个样本,(n x x x ,,,21 )是相应的样本观察值。
定义:∑==ni iXnX 11为样本均值∑=--=ni i X X n S 122)(11为样本方差。
2S S =为样本标准差∑==ni k i k X n A 11,k =1,2,3……为样本的k 阶原点矩∑=-=n i k i k X X n B 1)(1,k =1,2,3……为样本值的k 阶中心矩它们的观察值分别为:∑==ni i x n x 11;2s =∑=-n i i x x n 12)(1;2s s =;∑==n i ki k x n a 11;∑=-=n i k i k x x n b 1)(1;k =1,2,3…;统计量是我们对总体的分布函数或数字特征进行统计推断的最重要的基本概念,统计量的分布称为抽样分布。
然而要求出一个统计量的精确分布是十分困难的。
而在实际问题中,大多总体都服从正态分布,本节介绍来自正态总体的几个常用统计量的分布。
2.4 自由度在统计推断中,我们把一群数据或观测值可以独立自由变动的数目称为自由度,用符号n 表示。
例如有5个测量值为8,12,6,10,14,其平均数为10,现将其中四个数任意变动,如8变成5,12变成7,6变成10,14变成16,均数仍为10,那么10还能随意变动吗?显然不能,这时它因其它四个数的变化而成为定值12。
所以说均数一定时,上述观测值的标准差只有4个数可以独立自由地变化,有一个数因其他数的变化而被固定下来不能任意地变动。
2.5 抽样分布抽样分布是样本及统计量的分布。
具体的说,从一个给定的总体中抽取(不论是否有放回)容量(或大小)为n 的所有可能的样本,对于每一个样本,计算出某个统计量(如样本均值或标准差)的值,不同的样本得到的该统计量的值是不一样的,由此得到这个统计量的分布,称之为抽样分布。
统计量是样本的函数,它是一个随机变量。
统计量的分布称为抽样分布。
常用的抽样分布除了正态分布,还有t 分布、2χ分布、F 分布等。
3 常用抽样分布及其性质在数理统计中,本文讲解三大抽样分布:t 分布、2χ分布和F 分布。
以下就这三个分布一一介绍:3.1 2χ分布3.1.1 2χ分布 定义设(n X X X ,,,21 )是来自总体),(N ~X 10 的一个样本,则称统计量:∑==ni i X 122χ所服从的分布是自由度为n (n 指上式中所含独立变量的个数)的2χ分布。
记作:)n (~22χχ3.1.2 2χ分布的性质 性质1:2χ分布的可加性:设)(~1221n χχ,)(~2222n χχ,且21χ与22χ相互独立,则:21χ+~22χ)(212n n +χ 性质2:若)(~22n χχ,则:n E =χ)(2,n D 2)(2=χ,性质3:设(n X X X ,,,21 )为来自总体),(~2σμN X 的一个样本,μ,2σ为已知常数,则:统计量)(~22n χχ (当μ=0时也成立)样本均值X 与样本方差2S 相互独立,则统计量:)1(~)1(222--n Sn χσ。
3.2 t 分布3.2.1 t 分布的定义设)1,0(~N X ,)(~2n Y χ,且X 与Y 相互独立,则称随机变量:nY Xt =所服从的分布是自由度为n 的t 分布,记为)(~n t t ,t 分布又称为学生氏(Student )分布。
3.2.2 t 分布的性质性质1:t 分布图像关于x =0对称;性质2:t 分布图像在x =0达最大值; 性质3:t 分布图像以x 轴为水平渐近线; 性质4:当∞→n 时,t 分布)1,0(N →,3.3 F 分布3.3.1 F 分布定义设,)(~12n U χ)(~22n V χ,且U 与V 相互独立,则称随机变量21n V n U F =所服从的分布是自由度为),(21n n 的F 分布,记作:),(~21n n F F , 其中:1n 为第一自由度,2n 为第二自由度。
3.3.2 F 分布的性质性质1:密度曲线不对称;性质2:若)(~),(~2222n x Ym x X σσ,且X 与Y 独立,则:),(~n m F F nY m X=;性质3:若),(~n m F F ,则),(~1m n F F; 性质4:设(m X X X ,,,21 )是来自总体),(~211σμN X 的一个样本,(),,,21n Y Y Y 是来自总体),(~222σμN Y 的一个样本,且它们是相互独立,则)1,1(~22212122--σσ=n m F S S F4 几个常用抽样分布的应用在数理统计中,抽样分布具有广泛的应用,抽样分布在参数估计、假设检验、分布拟合检验、方差分析和回归分析中的应用,以下简介抽样分布在参数估计、假设检验、分布拟合检验中的简单应用:4.1 2χ分布的简单应用4.1.1 2χ分布在参数估计中的应用 设总体2~(,)x N μσ,则统计量()2221σχS n -=服从自由度为1-n 的2χ分布,即()()1~12222--=n S n χσχ可得到总体方差2σ的置信水平为 α-1 的置信区间为 ()()()()⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡-⋅--⋅--11112212222n S n n S n ααχχ, 4.1.2 2χ分布在参数假设检验中的应用我们知道,设总体2~(,)x N μσ,关于2σ假设检验问题:0H :202σσ=,221:σσ≠H 。