当前位置:文档之家› 用excel进行方差分析的实验报告

用excel进行方差分析的实验报告

实验四:用excel进行方差分析的实验报告实验目的:学会在计算机上利用excel进行单因素方差分析和有交互的双因素分析以及无交互的双因素分析,实验背景:方差分析是从观测变量的方差入手,研究诸多控制变量中哪些变量是对观测变量有显著影响的变量。

一个复杂的事物,其中往往有许多因素互相制约又互相依存。

方差分析的目的是通过数据分析找出对该事物有显著影响的因素,各因素之间的交互作用,以及显著影响因素的最佳水平等。

方差分析是在可比较的数组中,把数据间的总的“变差”按各指定的变差来源进行分解的一种技术。

对变差的度量,采用离差平方和。

实验内容:实验(1):单因素方差分析条件:单因素方差分析是对成组设计的多个样本均数比较,所以对数据格式有特殊要求,因素的不同水平作为表格的列(或行),在不同水平下的重复次数作为行(或列)。

例1:以下数据来自2009年中国统计年鉴,各地区农村居民家庭平均每人生活消费支出,按不同项目分组的不同地区:其中,1代表生活消费支出合计,2代表食品,3代表衣着,4代表居住, 5代表家庭设施及服务, 6代表交通和通讯, 7代表文教娱乐用品及服务,8代表医疗保健, 9代表其他商品及服务各地区农村居民家庭平均每人生活消费支出 (2009年)单位:元地区项目地区生活消费食品衣着居住家庭设备交通和文教娱乐医疗保健其他品支出合计及服务通讯用品及服务及务地区 1 2 3 4 5 6 7 8北京8897.59 2808.92 654.36 1798.88 528 1132.09 960.41 867.87 14天津4273.15 1848.11 324.63 674.67 187.83 481.27 371.85 299.79 8河北3349.74 1195.65 217.82 796.62 170.4 350.92 263.53 289.27 6山西3304.76 1224.6 283.2 584.07 156.27 324.89 416.94 240.94 7内蒙古3968.42 1578.57 271.88 609.29 148.03 466.34 390.85 416.87 8辽宁4254.03 1563.33 335.93 793.91 185.5 416.41 437.79 409.64 11吉林3902.9 1371.12 286.97 737.07 168.36 355.99 376.76 511.5 9黑龙江4241.27 1331.07 345.69 946.84 161.03 427.35 496.42 434.25 9上海9804.37 3639.14 496.14 2102.96 480.62 1212.38 942.76 738.94 19江苏5804.45 2275.28 306.62 969.76 286.37 691.56 818.45 322.99 13浙江7731.7 2812.39 473.11 1488.95 374.31 968.17 843.34 609.07 16安徽3655.02 1494.19 203.37 813.12 229.66 302.23 312.05 227.1福建5015.72 2304.14 291.72 821.21 260.68 570.24 421.69 219.02 12江西3532.66 1609.2 162.58 725.11 181.91 295.76 254.77 232.78 7山东4417.18 1618.66 265.59 945.81 273.77 533.55 399.95 301.55河南3388.47 1220.36 225.64 875.83 203.81 310.11 234.01 242.87 7湖北3725.24 1668.35 195.45 702.62 229.32 307.22 281.68 236.31 10步骤:(1)、在excel的分析工具库中中选择“方差分析:单因素方差分析”指定相应的数据区域和显著性水平,点击“确定”后输出最终输出结果:表一方差分析:单因素方差分析SUMMARY组观测数求和平均方差列 1 32 129281.5 4040.048 3465440列 2 32 52249.75 1632.805 428309.6列 3 32 7951.16 248.4738 15408.02列 4 32 25251.6 789.1125 162323.1列 5 32 6519.28 203.7275 10263列 6 32 13547.29 423.3528 66285.85列 7 32 11279.63 352.4884 55136列 8 32 9809.81 306.5566 31281.44列 9 32 2716.05 84.87656 1665.067 表一是各组数据的描述统计指标。

从各组的均值看,最低的为84.87656,最高的为4040.048。

从各组的方差看最小的为1665.067,最大的等于3465440。

判断数据是否符合同法差假设的一个经验方法是:如果各组织中最大的方差与最小方差之比不超过4,就可以认为是同法差。

此例子中的比值明显大于4,可能违背了同方差假设。

表2方差分析差异源SS df MS F P-value F crit组间 4.12E+08 8 51448014 109.3059 2.13E-81 1.971665组内 1.31E+08 279 470679.1总计 5.43E+08 287如果假设数据是同方差的,则方差分析中得到的p值2.13E-81小于0.05,因此拒绝零假设,检验的结论是以上项目对家庭平均每人生活消费支出有显著影响。

实验(2)进行无重复双因素方差分析无重复方差分析是分析两个因素对观测变量的独立影响。

例2:分析不同品种、不同施肥量对农作物产量的影响时,可将农作物产量作为观测变量,品种和施肥量作为控制变量。

利用双因素方差分析方法,研究不同品种、不同施肥量是如何影响农作物产量的,并进一步研究哪种品种与哪种水平的施肥量是提高农作物产量的最优组合。

如表所示为不同品种、不同施肥量对每亩农作物产量的影响单位(吨)。

施肥量(g)氮肥磷肥钾肥混合肥料1 0.256752 0.482131 0.475753 0.2850122 0.394818 0.591235 0.547889 0.4789273 0.780786 0.834162 0.099826 0.391984 0.951811 0.510636 0.450697 0.6657925 0.857387 0.466231 0.333811 0.9033786 0.429975 0.139531 0.107242 0.8754337 0.324168 0.050702 0.125126 0.7958018 0.152196 0.03456 0.04181 0.5709719 0.002747 0.000123 0.001456 0.47322步骤:在excel的分析工具库中中选择“方差分析:无重复双因素方差分析”指定相应的数据区域和显著性水平,点击“确定”后输出结果显示如下:方差分析:无重复双因素分析SUMMARY 观测数求和平均方差1 4 1.499649 0.374912 0.014572 4 2.012869 0.503217 0.0073613 4 2.106754 0.526688 0.1198214 4 2.578936 0.644734 0.0501245 4 2.560808 0.640202 0.0801916 4 1.552181 0.388045 0.1266387 4 1.295796 0.323949 0.112288 4 0.799537 0.199884 0.06419 4 0.477546 0.119387 0.055645氮肥9 4.150639 0.461182 0.108927 磷肥9 3.109312 0.345479 0.088124 钾肥9 2.183611 0.242623 0.04377 混合肥料9 5.440514 0.604502 0.048056方差分析差异源SS df MS F P-value F crit 行 1.072058 8 0.134007 2.595867 0.033646 2.355081 列0.653227 3 0.217742 4.217908 0.015714 3.008787 误差 1.23896 24 0.051623总计 2.964245 35从分析结果可以看出,行因素即不同品种的肥料的p值为0.033646小于0.05,列因素,即施肥量的p值为0.015714,也小于0.05,可见不同品种、不同施肥量农作物的产量有显著何影响。

所以提醒农民在种植农作物是要合理施肥,并不是施肥越多越好。

实验(3)进行有重复双因素方差分析与无重复的双因素方差分析方法不同,有重复的双因素方差分析可以分为有交互作用和无交互作用两种情况,无交互作用的双因素方差分析,它假定因素A和因素B的效应之间是相互独立的,不存在相互关系;有交互作用的双因素方差分析,它假定因素A和因素B的结合会产生出一种新的效应。

但excel只能分析有交互作用的情况。

例3:假定不同地区的消费者对某种颜色有与其他地区消费者不同的特殊偏爱,一家饮料公司在A、B、C、D、E五个地区销售茶饮料、营养快线、果汁三种饮料。

为了比较不同颜色的包装(红、黄、蓝)对销售额的影响,收集了一些数据,假设数据是正态分布和等方差的。

在0、05的显著性水平下,分析各因素及其交互作用是否显著。

如下图所示地区A B C D E产品类别茶饮料33.33383 28.2232 38.37822 33.59415 26.2789222.49046 4.670718 22.12519 25.45866 21.8648934.06555 43.30196 36.38367 41.65873 42.91192 营养快线32.20557 27.69192 32.42379 34.77793 34.5581216.12655 18.47858 22.37859 26.37849 34.8748936.14277 37.18354 26.45575 23.36641 30.36626果汁34.34963 40.78914 22.40878 33.49535 26.99414 39.82528 29.81375 26.38293 29.1184 42.51924 28.92406 26.879 29.69658 21.56876 17.35989步骤:在excel的分析工具库中中选择“方差分析:可重复双因素方差分析”指定相应的数据区域和显著性水平,并指明每种处理重复的次数,然后点击“确定”后输出输出结果如下:方差分析:可重复双因素分析SUMMARY A B C D E 总计茶饮料观测数 3 3 3 3 3 15求和89.88984 76.19588 96.88708 100.7115 91.05573 454.7401平均29.96328 25.39863 32.29569 33.57051 30.35191 30.316方差42.01611 379.0769 78.57396 65.61105 123.1864 106.67营养快线观测数 3 3 3 3 3 15求和84.4749 83.35404 81.25814 84.52284 99.79928 433.4092平均28.1583 27.78468 27.08605 28.17428 33.26643 28.89395方差112.4476 87.47538 25.52448 34.97431 6.333295 43.39572 果汁观测数 3 3 3 3 3 15求和103.099 97.48189 78.48829 84.1825 86.87327 450.1249平均34.36632 32.49396 26.16276 28.06083 28.95776 30.00833方差29.70937 53.76061 13.31434 36.3997 161.1401 51.65815 总计观测数9 9 9 9 9求和277.4637 257.0318 256.6335 269.4169 277.7283平均30.8293 28.55909 28.51483 29.93521 30.8587方差53.6913 139.855 37.5539 41.68236 76.29028方差分析差异源SS df MS F P-value F crit样本16.79379 2 8.396897 0.1008 0.904419 3.31583列48.34576 4 12.08644 0.14509 0.963768 2.689628交互276.7021 8 34.58777 0.415205 0.902686 2.266163内部2499.087 30 83.3029总计2840.929 44从分析结果可以看出,样本因素,即产品类别的P值为0.904419,大于0.05,则说明产品类别对销售收入没有显著影响,列因素颜色的P值也大于0.05,列因素地区的P 值也大于0.05,都说明地区、颜色对销售收入没有显著影响,这与现实意义不符合,这说明公司的调查人员在统计时,没有履行公正、客观、诚实的原则,数据的可靠性与真实性不高。

相关主题