数据分析实验报告
0.21 38412.85 37.97 76.98 0.11 35270.79 45.36 59.68 0.15 35200.76 34.93 60.82
0.19 35848.97 1.82 57.35 0.11 1.17 53.06 40348.43 0.12 50.96 0.16 40392.96
计算各指标的均值、方差、标准差、变异系数、偏度、峰度以及极差%A1=[mean(A);var(A);std(A);std(A)./mean(A);skewness(A,0);kurtosis(A,0)-3;range(A)]三均值%A2=[1/4 1/2 1/4]*prctile(A,[25 50 75])计算各指标的相关系数矩阵%A3=corrcoef(A)做出各指标数据直方图%subplot(221),histfit(A(:,1),8)subplot(222),histfit(A(:,2),8)subplot(223),histfit(A(:,3),8)subplot(224),histfit(A(:,4),7)检验该数据是否服从正态分布%i=1:4for[h(i),p(i),lstat(i),cv(i)]=lillietest(A(:,i),0.05);endh,p变换以后给出该数据的密度函数boxcox计算出前三列不服从正态分布,利用%[t1,I1]=boxcox(A(:,1))[t2,I2]=boxcox(A(:,2))[t3,I3]=boxcox(A(:,3))
4.掌握多元数据的数字特征与相关矩阵的处理方法;
实验内容
安徽省1990-2004年万元工业GDP废气排放量、废水排放量、固体废物排放量以及用于污染治理的投入经费比重见表6.1.1,解决以下问题:比重GDP废气、废水、固体废物排放量及污染治理的投入经费占表6.1.1年份1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 20041.计算各指标的均值、方差、标准差、变异系数以及相关系数矩阵;2.计算各指标的偏度、峰度、三均值以及极差;3.做出各指标数据直方图并检验该数据是否服从正态分布?若不服从正态分布,利用boxcox4.上网查找1990-2004否服从同样的分布?
万元工业GDP万元工业GDP万元工业GDP废环境污染治理投资占GDP废气排放量固体物排放量比重水排放量
(%(立方米)(千克))(吨)
0.18 519.48 104254.40 441.65 0.26 476.97 94415.00 398.19 0.23 332.14 89317.41 119.45 0.20 203.91 63012.42 67.93 0.17 128.20 45435.04 7.86 0.22 113.39 46383.42 12.45 0.15 13.24 39874.19 87.12
页眉内容.
共享知识分享快乐
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%江苏省数据J=[5047.00 24.23 2234.005730.00 24.00 2077.005352.00 22.49 2450.005202.00 21.16 2323.005772.14 21.16 2725.007872.11 22.02 2883.007450.81 21.97 2891.008164.24 22.01 2857.007487.85 20.29 2944.008353.93 20.11 2896.009078.20 20.19 3038.0013343.99 27.10 3553.0014286.46 26.30 3796.0014632.6924.75 3893.7017818.42 26.35 4672.5320196.58 29.63 5757.37];检验该数据是否服从正态分布%i=1:3for[h1(i),p1(i),lstat1(i),cv1(i)]=lillietest(J(:,i),0.05);endh1,p1变换以后给出该数据的密度函数boxcox%计算出第一、三列不服从正态分布,利用[t11,I11]=boxcox(J(:,1))[t33,I33]=boxcox(J(:,3)
0.15 43.94 37237.13 0.05 0.13
34176.27
36.90
0.06
变换以后给出该数据的密度函数;江苏省万元工业GDP废气排放量,安徽省与江苏省是
页眉内容.
共享知识分享快乐
程序如下:clear;clc保留两位小数bank%format
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%安徽省数据A=[104254.40 519.48 441.65 0.1894415.00 476.97 398.19 0.2689317.41 119.45 332.14 0.2363012.42 67.93 203.91 0.2045435.04 7.86128.20 0.1746383.42 12.45 113.39 0.2239874.19 13.24 87.12 0.1538412.85 37.97 76.98 0.2135270.79 45.36 59.68 0.1135200.76 34.93 60.82 0.1535848.97 1.82 57.35 0.1940348.43 1.17 53.06 0.1140392.960.16 50.96 0.1237237.13 0.05 43.94 0.1534176.27 0.06 36.90 0.13];
共享知识分享快乐
《数据分析》实验报告
班级:07信计0班学号:姓名:实验日期2010-3-11实验地点:实 验楼505
实验名称:样本数据的特征分析使用软件名称:MATLAB
实Hale Waihona Puke 目的1.熟练掌握利用Matlab软件计算均值、方差、协方差、相关系数、标准差与变异系数、偏度与峰度,中位数、分位数、三均值、四分位极差与极差;2.熟练掌握jbtest与lillietest关于一元数据的正态性检验;3.掌握统计作图方法;