应用统计spss分析报告学生姓名:肖浩鑫学号:31407371一、实验项目名称:实验报告(三)二、实验目的和要求(一)变量间关系的度量:包括绘制散点图,相关系数计算及显著性检验;(二)一元线性回归:包括一元线性回归模型及参数的最小二乘估计,回归方程的评价及显著性检验,利用回归方程进行估计和预测;(三)多元线性回归:包括多元线性回归模型及参数的最小二乘估计,回归方程的评价及显著性检验等,多重共线性问题与自变量选择,哑变量回归;三、实验内容1. 从某一行业中随机抽取12家企业,所得产量与生产费用的数据如下:企业编号产量(台)生产费用(万元)企业编号产量(台)生产费用(万元)1 40 130 7 84 1652 42 150 8 100 1703 50 155 9 116 1674 55 140 10 125 1805 65 150 11 130 1756 78 154 12 140 185(1)绘制产量与生产费用的散点图,判断二者之间的关系形态。
(2)计算产量与生产费用之间的线性相关系数,并对相关系数的显著性进行检验(),并说明二者之间的关系强度。
2. 下面是7个地区2000年的人均国内生产总值(GDP)和人均消费水平的统计数据:地区人均GDP(元)人均消费水平(元)北京22460 7326辽宁11226 4490上海34547 11546江西4851 2396河南5444 2208贵州2662 1608陕西4549 2035(1)绘制散点图,并计算相关系数,说明二者之间的关系。
(2)人均GDP作自变量,人均消费水平作因变量,利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。
(3)计算判定系数和估计标准误差,并解释其意义。
(4)检验回归方程线性关系的显著性()(5)如果某地区的人均GDP为5000元,预测其人均消费水平。
(6)求人均GDP为5000元时,人均消费水平95%的置信区间和预测区间。
3. 随机抽取10家航空公司,对其最近一年的航班正点率和顾客投诉次数进行调查,数据如下:(1)完成上面的方差分析表。
(2)汽车销售量的变差中有多少是由于广告费用的变动引起的?(3)销售量与广告费用之间的相关系数是多少?(4)写出估计的回归方程并解释回归系数的实际意义。
(5)检验线性关系的显著性(a=0.05)。
5. 随机抽取7家超市,得到其广告费支出和销售额数据如下F 14 53G 20 54(1) 用广告费支出作自变量,销售额为因变量,求出估计的回归方程。
(2) 检验广告费支出与销售额之间的线性关系是否显著(a=0.05)。
(3) 绘制关于的残差图,你觉得关于误差项的假定被满足了吗?(4) 你是选用这个模型,还是另寻找一个该更好的模型?6. 一家电气销售公司的管理人员认为,每月的销售额是广告费用的函数,并想通过广告费用对月销售额作出估计。
下面是近8个月的销售额与广告费用数据月销售收入y(万元)电视广告费用(万元)报纸广告费用(万元)96 5.0 1.590 2.0 2.095 4.0 1.592 2.5 2.595 3.0 3.394 3.5 2.394 2.5 4.294 3.0 2.5(1)用电视广告费用作自变量,月销售额作因变量,建立估计的回归方程。
(2)用电视广告费用和报纸广告费用作自变量,月销售额作因变量,建立估计的回归方程,并说明回归系数的意义。
(3)上述(1)和(2)所建立的估计方程,电视广告费用的系数是否相同?对回归系数分别解释。
(4)根据(1)和(2)所建立的估计方程,说明它们的R2的意义。
7. 某农场通过试验取得早稻收获量与春季降雨量和春季温度的数据如下收获量y (kg)降雨量x1 (mm)温度x2 ()2250 25 63450 33 84500 45 106750 105 137200 110 147500 115 168250 120 17系和回归系数进行检验(a=0.05),你认为模型中是否存在多重共线性?8. 一家房地产评估公司想对某城市的房地产销售价格(y)与地产的评估价值(x1 )、房产的评估价值(x2 )和使用面积(x3 )建立一个模型,以便对销售价格作出合理预测。
为此,收集了20栋住宅的房地产评估数据如下:房地产编号销售价格y(元/㎡)地产估价(万元)房产估价(万元)使用面积(㎡)1 6890 596 4497 187302 4850 900 2780 92803 5550 950 3144 112604 6200 1000 3959 126505 11650 1800 7283 221406 4500 850 2732 91207 3800 800 2986 89908 8300 2300 4775 180309 5900 810 3912 1204010 4750 900 2935 1725011 4050 730 4012 1080012 4000 800 3168 1529013 9700 2000 5851 2455014 4550 800 2345 1151015 4090 800 2089 1173016 8000 1050 5625 1960017 5600 400 2086 1344018 3700 450 2261 988019 5000 340 3595 1076020 2240 150 578 9620用SPSS进行逐步回归,确定估计方程,并给出销售价格的预测值及95%的置信区间和预测区间。
9. 为分析某行业中的薪水有无性别歧视,从该行业中随机抽取15名员工,有关的数据如下月薪y(元)工龄性别(1=男,0=女)1548 3.2 11629 3.8 11011 2.7 01229 3.4 01746 3.6 11528 4.1 11018 3.8 01190 3.4 01551 3.3 1985 3.2 01610 3.5 11432 2.9 11215 3.3 0990 2.8 01585 3.5 1进行回归并对结果进行分析。
四、实验数据记录与分析(基本要求:1.根据题号顺序记录软件输出结果并分析;2.结果可来自对SPSS或Excel进行操作的输出,二选一即可。
)1、(1)由图可知,产量与生产费用呈正线性相关(2)相关性产量生产费用产量Pearson 相关性 1 .920**显著性(双侧).000N 12 12生产费用Pearson 相关性.920** 1显著性(双侧).000N 12 12**. 在 .01 水平(双侧)上显著相关。
产量与生产费用之间的线性相关系数为0.0920,显著相关2、(1)相关性人均GDP 人均消费水平人均GDP Pearson 相关性 1 .998**显著性(双侧).000N 7 7 人均消费水平Pearson 相关性.998** 1显著性(双侧).000N 7 7 **. 在 .01 水平(双侧)上显著相关。
人均GDP与人均消费水平呈正线性相关,相关系数为0.998(2)人均GDP对人均消费的影响达到99.6%(4)F检验Anova b模型平方和df 均方 F Sig.1 回归8.144E7 1 8.144E7 1331.692 .000a残差305795.034 5 61159.007总计8.175E7 6a. 预测变量: (常量), 人均GDP。
b. 因变量: 人均消费水平t检验系数a模型非标准化系数标准系数B 标准误差试用版t Sig.1 (常量) 734.693 139.540 5.265 .003人均GDP .309 .008 .998 36.492 .000浙江大学城市学院 实 验 报 告 纸3、 5、b. 因变量: 人均消费水平(5)y=734.693+0.309*5000=2279.693如果某地区的人均GDP 为5000元,预测其人均消费水平为2279.693元(6)人均GDP 为5000元时,人均消费水平95%的置信区间为[2050.84067,2505.91078],预测区间为[1680.94287,2875.80857]。
3、(1)系数a模型非标准化系数标准系数t Sig. B标准 误差 试用版1(常量) 430.189 72.1555.962 .000 航班正点率-4.701.948-.869-4.959.001a. 因变量: 投诉次数回归方程:y=430.189-4.701x回归系数的含义:投诉次数每增加一次,航班正点率下降4.701%(2)由于Sig=0.001<0.05 显著(3)80=430.189-4.701 x=74 如果航班正点率为80%,估计顾客的投诉次数为74次 4、(1)Anova b模型 平方和 df均方 F Sig. 1回归 691.723 1 691.723 11.147.021a残差 310.277 5 62.055总计1002.0006a. 预测变量: (常量), 广告支出费用。
b. 因变量: 销售额Sig=0.021<0.05显著t 检验(3系数a模型非标准化系数 标准系数 t Sig. B标准 误差试用版1(常量) 29.399 4.8076.116.002 广告支出费用1.547.463.8313.339.021a. 因变量: 销售额回归方程估计是:y=29.399+1.547x (2)F 检验残差不全相等(4)应考虑其他模型,可考虑对数曲线模型:y=b0+b1ln(x)=22.471+11.576ln(x)6、(1)系数a模型非标准化系数标准系数t Sig.B 标准误差试用版1 (常量) 88.638 1.582 56.016 .000电视广告费用 1.604 .478 .808 3.357 .015 a. 因变量: 月销售收入估计的回归方程:y=88.64+1.6x(2)、系数a模型非标准化系数标准系数t Sig.B 标准误差试用版1 (常量) 83.230 1.574 52.882 .000电视广告费用 2.290 .304 1.153 7.532 .001报纸广告费用 1.301 .321 .621 4.057 .010 a. 因变量: 月销售收入估计的回归方程:y=83.23+2.29x1+1.301x2回归系数的意义:报纸广告费用不变的情况下,电视广告费用每增加1万元,月销售额增加2.29万元;电视广告费用不变的情况下,报纸广告费用每增加1万元,月销售额增加1.301万元。
(3)不相同,(1)中表示电视广告费用每增加1万元,月销售额增加1.6万元;(2)中表示电视广告费用每增加1万元,月销售额增加2.29万元(4)(1)中的含义为电视广告费用对月销售额达到的影响程度,(2)中的含义为电视广告费用和报纸广告费用对月销售额达到的影响程度7、系数a模型非标准化系数标准系数t Sig.B 标准误差试用版1 (常量) -.591 505.004 -.001 .999降雨量22.386 9.601 .415 2.332 .080温度327.672 98.798 .590 3.317 .029a. 因变量: 收获量Anova b模型平方和df 均方 F Sig.1 回归31226615.2572 15613307.629 228.444 .000a残差273384.743 4 68346.186总计31500000.000 6估计的回归方程:y=-0.591+22.386x1+327.672x2回归线性显著降雨量的回归系数不显著,温度的显著x1与x2的相关系数rx1x2=0.965,存在多重共线性8、估计的回归方程:y=11.653+0.163x1+0.961x2销售价格的预测值及95%的置信区间和预测区间:9、SUMMARY OUTPUT回归统计Multiple R 0.943391 R Square 0.889987 Adjusted RSquare0.871652 标准误差96.79158 观测值15 方差分析df SS MS F SignificanceF回归分析 2 909488.4 454744.2 48.53914 1.77E-06 残差12 112423.3 9368.61总计14 1021912Coefficients 标准误差t Stat P-value Lower 95% Upper 95%下限95.0%上限 95.0%Intercept 732.0606 235.5844 3.107425 0.009064 218.7664 1245.355 218.7664 1245.355 工龄111.2202 72.08342 1.542937 0.148796 -45.8361 268.2765 -45.8361 268.2765 性别(1=男,0=女)458.6841 53.4585 8.58019 1.82E-06 342.208 575.1601 342.208 575.1601 拟合优度良好,方程线性显著,工龄线性不显著,性别线性显著。