当前位置:
文档之家› Matlab在概率统计中的应用
Matlab在概率统计中的应用
对于向量x,得到x的方差值;对于矩阵X,得到一行向量, 它的每个值分别是矩阵X对应的列元素的方差值。 var(x,1) 得到向量(或矩阵)x的简单方差,即前置因 子为1/n的方差
var(x,w) 得到向量(或矩阵)x以w为权的方差
例如
var(x) ans = 3.5000 11.6000 var(x,1) ans = 2.9167
5.0000
0.1667
2.方差和标准差 随机变量x的方差为 D( x) var( x) E{[ x E ( x)]2 }
( x) D( x) 1 n ( xi x) 2 样本方差为 s 2 n 1 i 1 MATLAB的方差函数为Var 调用格式为
标准差
var(x)
17.9500 15.8000 -0.4500 -1.7500 4.7500
-1.5500 -3.5000 3.5000 -0.4500 -1.7500 4.7500 6.8000 2.7500 1.2500 2.7500 4.0000 -3.0000 1.2500 -3.0000 11.5000
corrcoef(X) ans = 1.0000 0.9563 -0.1259 -0.3706 0.2186 0.9563 1.0000 -0.0434 -0.2201 0.3524 -0.1259 -0.0434 1.0000 0.5273 0.1414 -0.3706 -0.2201 0.5273 1.0000 -0.4423 0.2186 0.3524 0.1414 -0.4423 1.0000
cov(x,1) 返回向量x的样本协方差矩阵,前置因子为1/n cov(x,y),cov(x,y,1)的区别同上
相关系数
corrcoef(x)
返回矩阵相关系数矩阵,其中x的每一行是一个观测值, x的每一列是一个变量 corrcoef(x,y) 返回向量x、y的相关系数 例如 X=[1 2 3 4 5;11 12 3 5 7;2 4 6 9 0;3 6 9 7 9;10 9 7 5 4]; cov(X) ans = 22.3000 17.9500 -1.5500 -3.5000 3.5000
H=0 表示“在显著性水平a的情况下,不能拒绝原假设”。
H=1 表示“在显著性水平a的情况下,可以拒绝原假设”。 P为显著性概率;ci表示置信水平为1-a的置信区间。 zval是检验统计量。
例如 某糖厂用自动包装机将糖果装箱,已知规定每箱的 标准重量为100公斤。设每箱重服从正态分布。由以往经 验知重量的均方差为0.9公斤。某天开工后检验包装机是
[H,p,ci,zval]=ztest(x,m,s,a,t)
说明
x是样本值,m是平均值的评判标准,s是已知的标准差,
alpha是显著水平,默认值为0.05,t为备择假设选项,只
有三个值0,1和-1,其中t=0表示“期望值不等于m”,
t=1表示“期望值大于m”, t=-1表示“期望值小于m”,t 的默认值为0。
例如
std(x) ans = 1.8708 std(x,1) ans = 1.7078
3.4059
0.4082
3.1091
0.3727
std(x,0,1) ans = 1.8708 3.4059
0.4082
std(x,0,2) ans = 3.4641 4.1633 4.5826 2.0817 2.5166 3.0000
std(x) 调用格式 对向量x,得到x的样本标准差(前置因子为1/n-1); 对于矩阵X,得到一行向量,它的每个值分别是矩阵X对 应的列元素的标准差 std(x,1) 得到向量(或矩阵)x的样本标准差(前置因 子为1/n) std(x,flag,dim) 得到向量(或矩阵)中以dim为维数的标准差。其中 flag=0时,前置因子为1/n-1,否则前置因子为1/n
当x是向量时,返回此向量的协方差;当x是矩阵时,返 回此矩阵的协方差矩阵,其中x的每一行是一个观测值, x的每一列是一个变量。由Cov(x)的对角元素为构成的向 diag 量是x的各列的方差所构成的向量, (cov( x)) 是标准差向量
cov(x,y) 返回向量x、y的协方差矩阵
cov(x)或cov(x,0) 返回向量x的样本协方差矩阵,前 置因子为1/n-1
三、假设检验 假设检验是统计推断的基本问题之一。在总体的分布函 数完全未知或只知其形式但不只参数的情况下,为了推 断总体的某些性质,提出某些关于总体的假设 假设检验首先提出假设H0,然后检验这组数据是否支持 这个假设。根据这组数据计算检验统计量以及显著性概 率(p值)。如果p值很小,则所提出的假设是非常可疑 的,并提供否定这个假设的证据。伴随假设H0,总能写 出备择假设H1,备择假设也称对立假设 1.σ 已知时的检验(z检验) MATLAB中的z检验由命令函数ztest来实现 调用格式
x=[ 1,5,7,9,1,6];y=[1,2,1,5,2,1]; cov(x,y,1) ans = 8.8056 2.1667 2.1667 2.0000 corrcoef(x,y) ans = 1.0000 0.5163 0.5163 1.0000
二、参数估计
当总体分布的数学形式已知,且可以用有限个参数表示时, 我们可以利用样本对参数进行估计,这便是参数估计 参数估计一般可分为点估计和区间估计 参数估计的方法:矩估计、最小二乘法和极大似然估计 1.二项分布的参数估计 MATLAB中由命令函数binofit来实现 [p,pci]=Binofit(x,N,alpha) 其中p为参数,pci为p的区间的端点,置信度为1-alpha x=[6,8,9,4,6,7,9,3,7,5] [p,pci]=binofit(x,10) 调用格式
p = 0.6000 0.8000 0.9000 0.4000 0.6000 0.7000 0.9000 0.3000 0.7000 0.5000 pci =0.2624 0.4439 0.5550 0.1216 0.2624 0.34750.5550 0.0667 0.3475 0.1871
0.8784 0.9748 0.9975 0.7376 0.8784 0.9333 0.9975 0.6525 0.9333 0.8129
2.正态分布的参数估计
MATLAB中由命令函数normfit来实现
[m,s,mci,sci]= normfit(x,alpha) [m,s,mci,sci]=normfit(x) m = 6.4000 s = 2.0111 mci = 4.9614 7.8386 sci =1.3833 3.6714
3.协方差和相关系数 二维随机变量(X,Y) 的协方差为 相关系数为
cov( x, y) E{[ x E ( x)][ y E ( y)]}
cov( x, y) cof ( x, y) D( x) D( y )
MATLAB中,协方差和相关系数函数cov和coffcoef实现 协方差 调用格式 cov(x)
否正常,随机抽取该包装机所包装的9箱,称得净重为
(公斤)99.3,98.7,100.5,101.2,98.3,99 .7,
105.1,102.6,100.5。取a=0.05,问机器是否正常?
解 可设σ =0.9,x~N(μ,0.92),提出假设 H0 μ=μ0=100 H1 μ≠100
x=[99.3 ,98.7 ,100.5 ,101.2 ,98.3 ,99.7 ,105.1 ,102.6 ,100.5]
一、统计量的数字特征
1 n 1.平均值 xi n i 1 MATLAB中mean(x)命令函数计算数据x的平均值
调用格式为 mean(x) 或mean(x,dim) 维数dim取值1,2 例如 x=[1 7 1;2 8 0;3 9 0; 4 1 0; 5 2 0; 6 3 0]; mean(x) ans = 3.5000 mean(x,2) ans = 3.0000 3.3333 4.0000 1.6667 2.3333 3.0000
[h,p,ci,t]=ztest(x,100,0.9,0.05,0)
h=1 p = 0.0289 ci =100.0676 101.2435 t = 2.1852
因此拒绝原假设H0,即自 动包装机工作是不正常的
2. σ未知时的检验(t检验) MATLAB中的t检验由命令函数ttest来实现 调用格式 [H,p,ci,tval]=ttest(x,m,a,t) 例如 某电子元件的寿命x(以小时计)服从正态分布, 均未知。测得16只元件的寿命为159 280 101 212 224 379 179 264 222 362 168 250 149 260 485 170
0.1667
9.6667
0.1389 0.3000
w =[ 0.0667 0.1667 0.2333 0.0333 0.2000] var(x,w) ans = 2.2225 11.3819 0.0623
样本标准差
1 n s ( xi x)2 n 1 i 1
MATLAB的标准差函数为std
公式),并利用所得公式进行统计
描述、分析和推断,以解决预测、
优化和控制问题。
线性回归的变量之间的关系为
y 0 1 x1 2 x2 m xm
yi 0 1 xi1 2 xi 2 m xim i
例如 在漂白工艺中要考察温度对针制品断裂强力的影响,
在70℃与80℃下分别作了7次和9次测试,其测试数据如
下(单位:公斤)
70 ℃ 20.5 18.8 20.9 21.5 19.5 21.6 21.8
80℃
17.7
19.2
20.3 20
Байду номын сангаас
18.6
19
19.1
20