应用统计s p s s分析报告TYYGROUP system office room 【TYYUA16H-TYY-TYYYUA8Q8-学生姓名:肖浩鑫学号:一、实验项目名称:实验报告(三)二、实验目的和要求(一)变量间关系的度量:包括绘制散点图,相关系数计算及显着性检验;(二)一元线性回归:包括一元线性回归模型及参数的最小二乘估计,回归方程的评价及显着性检验,利用回归方程进行估计和预测;(三)多元线性回归:包括多元线性回归模型及参数的最小二乘估计,回归方程的评价及显着性检验等,多重共线性问题与自变量选择,哑变量回归;三、实验内容企业编号产量(台)生产费用(万元)企业编号产量(台)生产费用(万元)1 40 130 7 84 1652 42 150 8 100 1703 50 155 9 116 1674 55 140 10 125 1805 65 150 11 130 1756 78 154 12 140 185(2)计算产量与生产费用之间的线性相关系数,并对相关系数的显着性进行检验(),并说明二者之间的关系强度。
2. 下面是7个地区2000年的人均国内生产总值(GDP)和人均消费水平的统计数地区人均GDP(元)人均消费水平(元)北京22460 7326辽宁11226 4490上海34547 11546江西4851 2396河南5444 2208贵州2662 1608陕西4549 2035(2)人均GDP作自变量,人均消费水平作因变量,利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。
(3)计算判定系数和估计标准误差,并解释其意义。
(4)检验回归方程线性关系的显着性()(5)如果某地区的人均GDP为5000元,预测其人均消费水平。
(6)求人均GDP为5000元时,人均消费水平95%的置信区间和预测区间。
3. 随机抽取10家航空公司,对其最近一年的航班正点率和顾客投诉次数进行调查,航空公司编号航班正点率(%)投诉次数(次)1 212 583 854 685 746 937 728 1229 1810 125系数的意义。
(2)检验回归系数的显着性()。
(3)如果航班正点率为80%,估计顾客的投诉次数。
4. 某汽车生产商欲了解广告费用(x)对销售量(y)的影响,收集了过去12年的有关数据。
通过计算得到下面的有关结果:变差来源df SS MS F Significance F回归残差——总计11———Coefficients标准误差t Stat P-valueInterceptX Variable 1(2)汽车销售量的变差中有多少是由于广告费用的变动引起的?(3)销售量与广告费用之间的相关系数是多少?(4)写出估计的回归方程并解释回归系数的实际意义。
(5)检验线性关系的显着性(a=)。
5. 随机抽取7家超市,得到其广告费支出和销售额数据如下超市广告费支出/万元销售额/万元A 1 19B 2 32C 4 44D 6 40E 10 52F 14 53G 20 54(1) 用广告费支出作自变量,销售额为因变量,求出估计的回归方程。
(2) 检验广告费支出与销售额之间的线性关系是否显着(a=)。
(3) 绘制关于的残差图,你觉得关于误差项的假定被满足了吗?(4) 你是选用这个模型,还是另寻找一个该更好的模型?6. 一家电气销售公司的管理人员认为,每月的销售额是广告费用的函数,并想通过月销售收入y(万元)电视广告费用(万元)报纸广告费用(万元)9690959295949494(2)用电视广告费用和报纸广告费用作自变量,月销售额作因变量,建立估计的回归方程,并说明回归系数的意义。
(3)上述(1)和(2)所建立的估计方程,电视广告费用的系数是否相同?对回归系数分别解释。
(4)根据(1)和(2)所建立的估计方程,说明它们的R2的意义。
收获量y (kg)降雨量x1 (mm)温度x2 ()2250 25 63450 33 84500 45 106750 105 137200 110 147500 115 168250 120 17建立早稻收获量对春季降雨量和春季温度的二元线性回归方程,并对回归模型的线性关系和回归系数进行检验(a=),你认为模型中是否存在多重共线性?8. 一家房地产评估公司想对某城市的房地产销售价格(y)与地产的评估价值(x1)、房产的评估价值(x2)和使用面积(x3)建立一个模型,以便对销售价格作出合理预测。
为此,收集了20栋住宅的房地产评估数据如下:房地产编号销售价格y(元/㎡)地产估价(万元)房产估价(万元)使用面积(㎡)1 6890 596 4497 187302 4850 900 2780 92803 5550 950 3144 112604 6200 1000 3959 126505 11650 1800 7283 221406 4500 850 2732 91207 3800 800 2986 89908 8300 2300 4775 180309 5900 810 3912 1204010 4750 900 2935 1725011 4050 730 4012 1080012 4000 800 3168 1529013 9700 2000 5851 2455014 4550 800 2345 1151015 4090 800 2089 1173016 8000 1050 5625 1960017 5600 400 2086 1344018 3700 450 2261 988019 5000 340 3595 1076020 2240 150 578 9620用SPSS进行逐步回归,确定估计方程,并给出销售价格的预测值及95%的置信区间和预测区间。
9. 为分析某行业中的薪水有无性别歧视,从该行业中随机抽取15名员工,有关的数月薪y(元)工龄性别(1=男,0=女)1548 11629 1四、实验数据记录与分析(基本要求:1.根据题号顺序记录软件输出结果并分析;2.结果可来自对SPSS或Excel进行操作的输出,二选一即可。
)1、(1)由图可知,产量与生产费用呈正线性相关(2)相关性产量生产费用产量Pearson 相关性1.920**显着性(双侧).000N1212生产费用Pearson 相关性.920**1显着性(双侧).000N1212**. 在 .01 水平(双侧)上显着相关。
产量与生产费用之间的线性相关系数为,显着相关2、(1)相关性人均GDP人均消费水平人均GDP Pearson 相关性1.998**显着性(双侧).000N77人均消费水平Pearson 相关性.998**1显着性(双侧).000N77**. 在 .01 水平(双侧)上显着相关。
人均GDP与人均消费水平呈正线性相关,相关系数为(2)系数a模型非标准化系数标准系数B标准误差试用版t Sig.1(常量).003(4)F检验Anova b模型平方和df均方F Sig.1回归1.000a 残差5总计6a. 预测变量: (常量), 人均GDP。
b. 因变量: 人均消费水平t检验系数a模型非标准化系数标准系数t Sig.B标准误差试用版1(常量).003人均GDP.309.008.998.0005、t检验(3)残差不全相等(4)应考虑其他模型,可考虑对数曲线模型:y=b0+b1ln(x)=+(x)系数a模型非标准化系数标准系数t Sig. B标准误差试用版1(常量).000电视广告费用.478.808.015 a. 因变量: 月销售收入估计的回归方程:y=+系数a模型非标准化系数标准系数t Sig. B标准误差试用版1(常量).000电视广告费用.304.001报纸广告费用.321.621.010a. 因变量: 月销售收入估计的回归方程:y=++回归系数的意义:报纸广告费用不变的情况下,电视广告费用每增加1万元,月销售额增加万元;电视广告费用不变的情况下,报纸广告费用每增加1万元,月销售额增加万元。
(3)不相同,(1)中表示电视广告费用每增加1万元,月销售额增加万元;(2)中表示电视广告费用每增加1万元,月销售额增加万元(4)(1)中的含义为电视广告费用对月销售额达到的影响程度,(2)中的含义为电视广告费用和报纸广告费用对月销售额达到的影响程度估计的回归方程:y=++回归线性显着降雨量的回归系数不显着,温度的显着x1与x2的相关系数rx1x2=,存在多重共线性估计的回归方程:y=++销售价格的预测值及95%的置信区间和预测区间:9、SUMMARY OUTPUT回归统计Multiple RR SquareAdjusted RSquare标准误差观测值15方差分析df SS MS F SignificanceF回归分析 2残差12总计14 1021912Coefficients 标准误差t Stat P-value Lower 95% Upper 95% 下限 % 上限 % Intercept工龄性别(1=男,0=女)拟合优度良好,方程线性显着,工龄线性不显着,性别线性显着。