当前位置:文档之家› 数据的统计分析与描述

数据的统计分析与描述


据,因而峰度可用作衡量偏离正态分布的尺度之一.
4.
k 阶原点矩:Vk
1 n
n i 1
X
k i
k 阶中心矩:U k
1 n
n
(Xi
i 1
X )k
三、常见概率分布的函数
常见的几种分布的命令字符为:
正态分布:norm
指数分布:exp
帕松分布:poiss
分布:beta
威布尔分布:weib
2 分布:chi2
数据的统计描述和分析
2020/4/24
1
实验目的
1、直观了解统计基本内容。 2、掌握用数学软件包求解统计问题。
实验内容
1、统计的基本理论。 2、用数学软件包求解统计问题。 3、实验作业。
数 据 的 统 计 描 述 和 分 析
2020/4/24
统计的基本概念 参数估计 假设检验
3
统计工具箱中的基本统计命令
2、分别以x和y代表变量职工工资总额和商品零售总额。 x=[23.8,27.6,31.6,32.4,33.7,34.9,43.2,52.8,63.8,73.4] y=[41.4,51.8,61.7,67.9,68.7,77.5,95.9,137.4,155.0,175.0]
3、将变量t、x、y的数据保存在文件data中。 save data t x y
2、将矩阵data的数据保存在文件data1中:save data1 data
3、进行统计分析时,先用命令: load data1 调用数据文件data1中的数据,再用以下命令分别将矩阵 data的第一、二、三行的数据赋给变量t、x、y:
t=data(1,:) x=data(2,:) y=data(3,:) 若要调用矩阵data的第j列的数据,可用命令:
1.数据的录入、保存和调用 2.基本统计量 3.常见概率分布的函数 4.频 数 直 方 图 的 描 绘 5.参数估计 6.假设检验
2020/4/24
返回
4
统计工具箱中的基本统计命令
一、数据的录入、保存和调用
例1 上海市区社会商品零售总额和全民所有制职工工资总额 的数据如下
年份 职工工资总额 (亿元) 商品零售总额 (亿元)
data(:,j)
2020/4/24
7
二、统计量
1、表示位置的统计量—平均值和中位数
平均值(或均值,数学期望): X
1 n
n i 1
Xi
mean(x)
中位数:将数据由小到大排序后位于中间位置的那个数值.median(x)
2、表示变异程度的统计量—标准差、方差和极差
标准差: s
[ 1 n 1
n i 1
2020/4/24
14
2、概率分布:P=normcdf(x,mu,sigma)
例 3. 计算标准正态分布的概率 P{-1<X<1}. 命令为:P=normcdf(1)-normcdf(-1)
结果为:P =0.6827
3、逆概率分布:x=norminv(P,mu,sigma). 即求出x ,使得 P{X<x}=P.此命令可用来求分位数.
2020/4/24
13
如对均值为mu、标准差为sigma的正态分布,举例如下:
1、密度函数:p=normpdf(x,mu,sigma) (当mu=0,sigma=1时可缺省)
例 2 画出正态分布N (0,1) 和N(0,22 ) 的概率密度函数图形. 在Matlab中输入以下命令: x=-6:0.01:6; y=normpdf(x); z=normpdf(x,0,2); plot(x,y,x,z)
(Xi
1
X )2]2
std(x)
它是各个数据与均值偏离程度的度量.
方差:标准差的平方.
var(x)
极差:样本中最大值与最小值之差.
偏度:skewness(x) 峰度:kurtosis(x)
3. 表示分布形状的统计量—偏度和峰度
偏度: g11 s3nFra bibliotek(Xi
i 1
X )3
峰度: g 2
1 s4
n
78 23.8
41.4
79 80 27.6 31.6
51.8 61.7
81 32.4
67.9
82 82 84 85 33.7 34.9 43.2 52.8
86 63.8
87 73.4
68.7 77.5 95.9 137.4 155.0 175.0
2020/4/24
5
1、年份数据以1为增量,用产生向量的方法输入。 命令格式: x=a:h:b t=78:87
例 4 取 0.05 ,求u 1 2
u1 2
的含义是: X
~
N (0,1) ,P{X<u1 2
}=1
2
0.05 时,P=0.975, u0.975 norminv(0.975)=1.96
2020/4/24
15
4、均值与方差:[m,v]=normstat(mu,sigma)
例5 求正态分布N(3,52)的均值与方差. 命令为:[m,v]=normstat(3,5) 结果为:m=3,v=25
t 分布:t
F 分布:F
Matlab工具箱对每一种分布都提供五类函数,其命令字符为:
概率密度:pdf
概率分布:cdf
逆概率分布:inv 均值与方差:stat
随机数生成:rnd
(当需要一种分布的某一类函数时,将以上所列的分布命令字符 与函数命令字符接起来,并输入自变量(可以是标量、数组或矩阵) 和参数即可.)
5、随机数生成:normrnd(mu,sigma,m,n).产生m n阶的正态 分布随机数矩阵.
例6 命令:M=normrnd([1 2 3;4 5 6],0.1,2,3) 结果为:M=0.9567 2.0125 2.8854 3.8334 5.0288 6.1191
4、进行统计分析时,调用数据文件data中的数据。 load data
2020/4/24
6
1、输入矩阵: data=[78,79,80,81,82,83,84,85,86,87,88; 23.8,27.6,31.6,32.4,33.7,34.9,43.2,52.8,63.8,73.4; 41.4,51.8,61.7,67.9,68.7,77.5,95.9,137.4,155.0,175.0]
(Xi
i 1
X )4
偏度反映分布的对称性,g1 >0 称为右偏态,此时数据位于均值 右边的比位于左边的多;g1 <0 称为左偏态,情况相反;而 g1 接近 0 则可认为分布是对称的.
峰度是分布形状的另一种度量,正态分布的峰度为 3,若 g2 比 3 大很多,表示分布有沉重的尾巴,说明样本中含有较多远离均值的数
相关主题