概率论与数理统计数学实验目录实验一几个重要的概率分布的MATLAB实现 p2-3 实验二数据的统计描述和分析 p4-8 实验三参数估计 p9-11 实验四假设检验 p12-14 实验五方差分析 p15-17 实验六回归分析 p18-27实验一 几个重要的概率分布的MATLAB 实现实验目的(1) 学习MATLAB 软件与概率有关的各种计算方法 (2) 会用MATLAB 软件生成几种常见分布的随机数 (3) 通过实验加深对概率密度,分布函数和分位数的理解Matlab 统计工具箱中提供了约20种概率分布,对每一种分布提供了5种运算功能,下表给出了常见8种分布对应的Matlab 命令字符,表2给出了每一种运算功能所对应的Matlab 命令字符。
当需要某一分布的某类运算功能时,将分布字符与功能字符连接起来,就得到所要的命令。
例1 求正态分布()2,1-N ,在x=1.2处的概率密度。
解:在MATLAB 命令窗口中输入: normpdf(1.2,-1,2) 结果为: 0.1089例2 求泊松分布()3P ,在k=5,6,7处的概率。
解:在MATLAB 命令窗口中输入: poisspdf([5 6 7],3) 结果为:0.1008 0.0504 0.0216 例3 设X 服从均匀分布()3,1U ,计算{}225P X .-<<。
解:在MATLAB 命令窗口中输入: unifcdf(2.5,1,3)-unifcdf(-2,1,3) 结果为:0.75000例4 求概率995.0=α的正态分布()2,1N 的分位数αX 。
解:在MATLAB 命令窗口中输入: norminv(0.995,1,2) 结果为:6.1517例5 求t 分布()10t 的期望和方差。
解:在MATLAB 命令窗口中输入: [m,v]=tstat(10) m = 0 v =1.2500例6 生成一个2*3阶正态分布的随机矩阵。
其中,第一行3个数分别服从均值为1,2,3;第二行3个数分别服从均值为4,5,6,且标准差均为0.1的正态分布。
解:在MATLAB 命令窗口中输入: A=normrnd([1 2 3;4 5 6],0.1,2,3) A =1.11892.0327 2.98133.9962 5.0175 6.0726例7 生成一个2*3阶服从均匀分布()3,1U 的随机矩阵。
解:在MATLAB 命令窗口中输入: B=unifrnd(1,3,2,3) B =1.8205 1.11582.62632.7873 1.7057 1.0197注:对于标准正态分布,可用命令randn(m,n);对于均匀分布()1,0U ,可用命令rand(m,n)。
实验二 数据的统计描述和分析实验目的(1) 学习MATLAB 软件关于统计作图的基本操作 (2) 会用MATLAB 软件计算计算几种常用统计量的值(3) 通过实验加深对均值、方差、中位数等常用统计量的理解 1. 频数表和直方图一组数据(样本观察值)虽然包含了总体的信息,但往往是杂乱无章的,作出它的频数表和直方图,可以看作是对这组数据的一个初步整理和直观描述。
将数据的取值范围划分为若干个区间,然后统计这组数据在每个区间中出现的次数,称为频数,由此得到一个频数表。
以数据的取值为横坐标,频数为纵坐标,画出一个阶梯形的图,称为直方图,或频数分布图。
2 经验累计分布函数图设n x x x ,,,21 是总体X 的一个容量为n 的样本观察值。
将n x x x ,,,21 按自小到大的次序排列,并重新编号,设为()()()n x x x ≤≤≤ 21记()()()()()⎪⎪⎩⎪⎪⎨⎧≥-=<≤<=+n k k n x x n k x x x n kx x x F ,11,,2,1,,,011 则称()x F n 为总体X 的经验累积分布函数,它的图像即为经验累计分布函数图。
3 几种常用的统计量 (1)算术平均值和中位数算术平均值(简称均值),∑==ni i X n X 11 ,中位数是将数据由小到大排序后位于中间位置的那个数值。
(2)标准差、方差标准差: ()211211⎥⎦⎤⎢⎣⎡--=∑=ni i X X n s ,它是各个数据与均值偏离程度的度量。
方差是标准差的平方,记为2s 。
(3)偏度和峰度表示数据分布形状的统计量有偏度和峰度。
偏度:()∑=-=ni iX Xsg 13311反映数据分布对称性的指标,当01>g 时,称为右偏态,此时数据位于均值右边的比位于左边的多;当01<g 时称为左偏态,情况相反;而1g 接近0时,则可认为分布是对称的。
峰度:()∑=-=ni iX Xsg 14421),是数据分布形状的另一种度量,正态分布的峰度为3,若2g 比3大得多,表示分布有沉重的尾巴,说明样本中含有较多远离均值的数据,因而峰度可以用作衡量偏离正态分布的尺度之一。
将样本的观测值()n x x x ,,,21 代入以上各式后,即可求得对应统计量的观测值。
4 MATLAB 实现下面我们列出用于数据的统计描述和分析的常用MATLAB 命令。
其中,x 为原始数据行向量。
(1)用hist 命令实现作频数表及直方图,其用法是:[n,y] = hist(x,k)返回x 的频数表。
它将区间[min(x),max(x)]等分为k 份(缺省时k 设定为10),n 返回k 个小区间的频数,y 返回k 个小区间的中点。
hist(x,k)返回x 的直方图。
(2)用cdfplot 命令作累积分布函数图,其用法是:[h,stats] =cdfplot(x)在返回x 的累积分布函数图的同时,在stats 中给出样本的一些特征:样本最小值、最大值、平均值、中位数和标准差。
cdfplot(x,k)则直接返回x 的累积分布函数图。
(3)算术平均值和中位数Matlab 中mean(x)返回x 的均值,median(x)返回中位数。
(4)标准差、方差和极差极差是n x x x ,,,21 的最大值与最小值之差。
Matlab 中std(x)返回x 的标准差,var(x)返回方差,range(x)返回极差。
(4)偏度和峰度Matlab 中skewness(x)返回x 的偏度,kurtosis(x)返回峰度。
例1 某学校随机抽取100名学生,测量他们的身高,所得数据如下表解:在MATLAB 命令窗口中输入:X=[172 169 169 171 167 178 177 170 167 169 171 168 165 169 168 173 170 160 179 172 166 168 164 170 165 163 173 165 176 162 160 175 173 172 168 165 172 177 182 175 155 176 172 169 176 170 170 169 186 174 173 168 169 167 170 163 172 176 166 167 166 161 173 175 158 172 177 177 169 166 170 169 173 164 165 182 176 172 173 174 167 171 166 166 172 171 175 165 169 168 173 178 163 169 169 177 184 166 171 170]; [n,y]=hist(X) n =2 3 6 18 26 22 11 8 2 2 y =156.5500 159.6500 162.7500 165.8500 168.9500 172.0500 175.1500 178.2500 181.3500 184.4500 hist(X)直方图x1=mean(X)x1 =170.2500x2=median(X)x2 =170x3=range(X)x3 =31x4=std(X)x4 =5.4018x5=skewness(X)x5 =0.1545x6=kurtosis(X)x6 =3.5573例2 产生50个服从标准正态分布的随机数,指出它们的分布特征,并画出经验累积分布函数图解:在MATLAB命令窗口中输入:x=normrnd(0,1,1,50);[h,stats]=cdfplot(x)h =171.0016stats =min: -2.9443max: 3.5784mean: 0.2840 median: 0.3222 std: 1.2625xF (x )Empirical CDF经验累积分布函数图实验三 参数估计实验目的(1) 学习MATLAB 软件关于参数估计的有关操作命令 (2) 会用MATLAB 软件求参数的点估计和置信区间 (3) 通过实验加深对参数估计基本概念和基本思想的理解 1 参数估计的方法利用样本对总体进行统计推断的一类问题是参数估计,即假定总体的概率分布类型已知,由样本估计参数的分布。
参数估计的方法主要有点估计和区间估计两种。
2 参数估计的Matlab 实现在Matlab 统计工具箱中,有专门计算总体均值、标准差的点估计和区间估计的函数。
对于正态总体,命令是[mu,sigma,muci,sigmaci]=normfit(x,alpha)其中x 为样本(数组或矩阵),alpha 为显著性水平α(alpha 缺省时设定为0.05),返回总体均值和标准差的点估计mu 和sigma ,及总体均值和标准差的区间估计muci 和sigmaci 。
当x 为矩阵时返回行向量。
此外,Matlab 统计工具箱中还提供了一些具有特定分布总体的区间估计的命令,如expfit ,poissfit ,分别用于指数分布和泊松分布的区间估计,具体用法可参见MATLAB 的帮助系统。
例1 已知某种木材横纹抗压力的实验值),(~2σμN X ,对10个试件做横纹抗压力的试验数据如下:482,493,457,471,510,446,435,418,394,496(单位:公斤/平方厘米),试以95%的可靠性估计该木材的平均横纹抗压力的置信区间:(1)2σ未知; (2) 2230=σ。
解:(1) 2σ未知时,可直接使用normfit 命令在MATLAB 命令窗口中输入:x=[482,493,457,471,510,446,435,418,394,496]; [mu sigma muci sigmaci]=normfit(x) mu =460.2 sigma =37.1776515904082 muci =433.60471018703 486.79528981297 sigmaci =25.5720976681307 67.87189930561422σ未知时,平均横纹抗压力μ的估计值为460.2,其置信度为0.95的置信区间为[433.6,486.8]。