数据分析实验报告
共学知识分享快乐
《数据分析》实验报告
班级:07信计0班 学号:姓名:实验日期2010-3-11实验地点:实.
验楼505
实验名称:样本数据的特征分析使用软件名称:MATLAB
实 验 目 的
1•熟练掌握利用Mat lab软件计算均值、方差、协方差、相关系数、标准差 与 变异系数、偏度与峰度,中位数、分位数、三均值、四分位极差与极差;2.熟练掌握jbtest与lillietest关于一元数据的正态性检验;3.掌握统计 作图方法;
给出该数据的密度函数boxcox计算出前三列不服从『布,利用%[tl.IlJ^oxcoxCACM))
[t2,12]=boxcox(A(:, 2))[t3,13]=boxcox(A(:,3))
页眉内容.
共享知识分享快乐
划Wi%%划wm號觥眺紙%%%%%%魁就W酬旣江苏省数抑;J=[5017.0024.232234.00 5730.0021.00
二均值弔A2=[l/4 1/2 l/4]*prctile(A, [25 50 75]) il算各指标的相关系数矩阵%A3=corrcoef (A)做出各指标数据贞方图 %subplot(221),histf it (A(:, 1), 8)subplot (222), hi st fit (A(:, 2), 8) subplot (223), histfit (A(:, 3), 8) subplot (224), histfit (A(:,4), 7)检验该数据是否丿扱从lE态分 布 §i=l:4for[h(i),p(i)» lstat(i), cv(i)]=lillietest (A(:,i)f0. 05);endh, p变换以后
2077.005352.0022.492450.005202.0021.162323.005772.1421.162725.007872.11
22.022883.007150.8121.972891.008161.2422.012857.007487.8520.292944.00
8353.9320.112896.009078.2020.193038.0013313.9927.103553.0014286.16
53. 060. 11 10392. 960. 1650. 960. 12 37237. 130. 0543. 940. 15 31176. 27
0.0636.900. 13];
il算各指标的均值、方差.标准差.变界系数、偏度.峰度以及极
Z?oAl=[mean(A);var(A);std(A):std(A). /mean(A):skewness(A, 0);kurtosis(A, 0)*3;range(A)]
26.303796.0014632.6924.753893.7017818.4226.354672.53 20196.58
29.635757. 37];检验该数据是否服从正态分布%i=l:3for
[hl(i)> pl(i), lstatl(i), cvl(i)] =lillietest(J(:ti),0. 05);endhl, pl变换以后给出该数按:的 密度函数boxcox%计算出第一.三列不服从正态分布,利用[tll,Ill]=boxcox(J(:」))
0.2138412.8537.9776. 9S 0.1135270.7945.3659. 6S 0.1535200.7634.9360.82
0.19 35818.971.82 57.350.111.1753.06 40348.430.1250.96 0.1640392.96
0.1543.9137237.130.050.13
万元工业GDP万元工业GDP万元工业GDP废坏境污染治理投资占GDP废气排放址固体 物排放量比觅水排放址
(% (立方米)(T•克))(吨)
0.18519.48104254.10441.65 0.26476.9794415.0039S.190.23332.14S9317.41119.150.20203.9163012.1267.930.1712S.2015135.017.860.22113.39163S3.4212.450.1513.2439874.1987.12
203. 91 0.20 45435.047.86128. 20 0. 17 46383. 4212. 45113. 39 0. 22 39874. 19
13.2487. 120.15 38112.8537.9776.980.21 35270.7945.3659.680. 11
35200. 7634. 9360. 820. 15 35848. 971.8257. 350. 19 40318.431. 17
34176.27
36.90
0.06
变换以后给H安徽省与江苏省
匕该数据的密度函数;江苏省万元工业GDP废气排放量,
是
页眉内容.
共拿知识分享快乐
程序如 卜:cl ear:clc氓留两位小数bank%f ormat
省数据A二[104254. 40519. 48 141. 65 0. 18
94415.00476. 97 39 14 0.23 63012.4267.93
4.掌握多元数据的数字特征与相关矩阵的处理方法;
实 验 内 容
安徽省1990-2004年万元工业GDP废气排放量、废水排放量、固体废物排放 量以及用于污染治理的投入经费比重见表6.1.1,解决以下问题:比重GDP废 气、废水、固体废物排放屋及污染治理的投入经费占表6・1・1年份1990 1991 1992 1993 1991 1995 1996 1997199S1999 2 000 2001 2002 2003 20011.计算各指标的均值、方差、标准差、变异 系数以及相关系数矩阵;2•计算各指标的偏度、峰度、三均值以及极差;3.做出各指标数据直方图并检验该数据是否服从正态分布?若不服从正态 分布,利用boxcox4・上网查找1990-2004否服从同样的分布?
[t33,133]=boxcox(J(:,3)