当前位置:文档之家› 数据分析实验报告

数据分析实验报告

A1=[mean(A);var(A);std(A);std(A)./mean(A);skewness(A,0);kurtosis(A,0)-3;range(A)]
%三均值
A2=[1/4 1/2 1/4]*prctile(A,[25 50 75])
%计算各指标的相关系数矩阵
A3=corrcoef(A)
否服从同样的分布?
程序如下:
clear;clc
formatbank%保留两位小数
%%%%%%%%%%%%%%%%安徽省数据%%%%%%%%%%%%%%%%%%
A=[104254.40 519.48 441.65 0.18
94415.00 476.97 398.19 0.26
89317.41 119.45 332.14 0.23
《数据分析》实验报告
班级:07信计0班学号:姓名:实验日期2010-3-11实验地点:实验楼505
实验名称: 样本数据的特征分析使用软件名称:MATLAB
实验目的
1.熟练掌握利用Matlab软件计算均值、方差、协方差、相关系数、标准差
与变异系数、偏度与峰度,中位数、分位数、三均值、四分位极差与极差;
35200.76 34.93 60.82 0.15
35848.97 1.82 57.35 0.19
40348.43 1.17 53.06 0.11
40392.96 0.16 50.96 0.12
37237.13 0.05 43.94 0.15
34176.27 0.06 36.90 0.13];
%计算各指标的均值、方差、标准差、变异系数、偏度、峰度以及极差
%%%%%%%%%%%%%%%%江苏省数据%%%%%%%%%%%%%%%%%
J=[5047.00 24.23 2234.00
5730.00 24.00 2077.00
5352.00 22.49 2450.00
5202.00 21.16 2323.00
5772.14 21.16 2725.00
7872.11 22.02 2883.00
7450.81 21.97 2891.00
8164.24 22.01 2857.00
7487.85 20.29 2944.00
8353.93 20.11 2896.00
9078.20 20.19 3038.00
13343.99 27.10 3553.00
14286.46 26.30 3796.00
14632.69 24.75 3893.70
[h(i),p(i),lstat(i),cv(i)]=lillietest(A(:,i),0.05);
end
h,p
%计算出前三列不服从正态分布,利用boxcox变换以后给出该数据的密度函数
[t1,I1]=boxcox(A(:,1))
[t2,I2]=boxcox(A(:,2))
[t3,I3]=boxcox(A(:,3))
2.熟练掌握jbtest与lillietest关于一元数据的正态性检验;
3.掌握统计作图方法;
4.掌握多元数据的数字特征与相关矩阵的处理方法;
实验内容
安徽省1990-2004年万元工业GDP废气排放量、废水排放量、固体废物排放量以及用于污染治理的投入经费比重见表6.1.1,解决以下问题:
表6.1.1废气、废水、固体废物排放量及污染治理的投入经费占GDP比重
年份
万元工业GDP废气排放量
万元工业GDP固体物排放量
万元工业GDP废水排放量
环境污染治理投资占GDP比重
(立方米)
(千克)
(吨)
(%)
1990
104254.40
519.48
441.65
0.18
1991
94415.00
476.97
399.45
332.14
0.23
%做出各指标数据直方图
subplot(221),histfit(A(:,1),8)
subplot(222),histfit(A(:,2),8)
subplot(223),histfit(A(:,3),8)
subplot(224),histfit(A(:,4),7)
%检验该数据是否服从正态分布
fori=1:4
63012.42 67.93 203.91 0.20
45435.04 7.86 128.20 0.17
46383.42 12.45 113.39 0.22
39874.19 13.24 87.12 0.15
38412.85 37.97 76.98 0.21
35270.79 45.36 59.68 0.11
0.13
1.计算各指标的均值、方差、标准差、变异系数以及相关系数矩阵;
2.计算各指标的偏度、峰度、三均值以及极差;
3.做出各指标数据直方图并检验该数据是否服从正态分布?若不服从正态
分布,利用boxcox变换以后给出该数据的密度函数;
4.上网查找1990-2004江苏省万元工业GDP废气排放量,安徽省与江苏省是
0.11
1999
35200.76
34.93
60.82
0.15
2000
35848.97
1.82
57.35
0.19
2001
40348.43
1.17
53.06
0.11
2002
40392.96
0.16
50.96
0.12
2003
37237.13
0.05
43.94
0.15
2004
34176.27
0.06
36.90
[t11,I11]=boxcox(J(:,1))
[t33,I33]=boxcox(J(:,3)
实验结果分析
1.各指标的均值、方差、标准差、变异系数、偏度、峰度、极差和三均值如
下表:
指标
数字特征
17818.42 26.35 4672.53
20196.58 29.63 5757.37];
%检验该数据是否服从正态分布
fori=1:3
[h1(i),p1(i),lstat1(i),cv1(i)]=lillietest(J(:,i),0.05);
end
h1,p1
%计算出第一、三列不服从正态分布,利用boxcox变换以后给出该数据的密度函数
1993
63012.42
67.93
203.91
0.20
1994
45435.04
7.86
128.20
0.17
1995
46383.42
12.45
113.39
0.22
1996
39874.19
13.24
87.12
0.15
1997
38412.85
37.97
76.98
0.21
1998
35270.79
45.36
59.68
相关主题