浙江大学城市学院 实 验 报 告 纸 1 学生姓名: 肖浩鑫 学号:31407371
一、实验项目名称:实验报告(三) 二、实验目的和要求 (一)变量间关系的度量:包括绘制散点图,相关系数计算及显著性检验; (二)一元线性回归:包括一元线性回归模型及参数的最小二乘估计,回归方程的评价及显著性检验,利用回归方程进行估计和预测; (三)多元线性回归:包括多元线性回归模型及参数的最小二乘估计,回归方程的评价及显著性检验等,多重共线性问题与自变量选择,哑变量回归; 三、实验内容 1. 从某一行业中随机抽取12家企业,所得产量与生产费用的数据如下: 企业编号 产量(台) 生产费用(万元) 企业编号 产量(台) 生产费用(万元) 1 40 130 7 84 165 2 42 150 8 100 170 3 50 155 9 116 167 4 55 140 10 125 180 5 65 150 11 130 175 6 78 154 12 140 185 (1)绘制产量与生产费用的散点图,判断二者之间的关系形态。 (2)计算产量与生产费用之间的线性相关系数,并对相关系数的显著性进行检验( ),并说明二者之间的关系强度。
2. 下面是7个地区2000年的人均国内生产总值(GDP)和人均消费水平的统计数据: 地区 人均GDP(元) 人均消费水平(元) 北京 22460 7326 辽宁 11226 4490 上海 34547 11546 江西 4851 2396 河南 5444 2208 贵州 2662 1608 陕西 4549 2035 浙江大学城市学院 实 验 报 告 纸 2 (1)绘制散点图,并计算相关系数,说明二者之间的关系。 (2)人均GDP作自变量,人均消费水平作因变量,利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。 (3)计算判定系数和估计标准误差,并解释其意义。 (4)检验回归方程线性关系的显著性( ) (5)如果某地区的人均GDP为5000元,预测其人均消费水平。 (6)求人均GDP为5000元时,人均消费水平95%的置信区间和预测区间。
3. 随机抽取10家航空公司,对其最近一年的航班正点率和顾客投诉次数进行调查,数据如下: 航空公司编号 航班正点率(%) 投诉次数(次) 1 81.8 21 2 76.6 58 3 76.6 85 4 75.7 68 5 73.8 74 6 72.2 93 7 71.2 72 8 70.8 122 9 91.4 18 10 68.5 125 (1)用航班正点率作自变量,顾客投诉次数作因变量,估计回归方程,并解释回归系数的意义。 (2)检验回归系数的显著性( )。 (3)如果航班正点率为80%,估计顾客的投诉次数。
4. 某汽车生产商欲了解广告费用(x)对销售量(y)的影响,收集了过去12年的有关数据。通过计算得到下面的有关结果: 方差分析表
变差来源 df SS MS F Significance F 回归 2.17E-09 残差 40158.07 — — 总计 11 1642866.67 — — — 参数估计表 Coefficients 标准误差 t Stat P-value Intercept 363.6891 62.45529 5.823191 0.000168 X Variable 1 1.420211 0.071091 19.97749 2.17E-09 (1)完成上面的方差分析表。 (2)汽车销售量的变差中有多少是由于广告费用的变动引起的? 浙江大学城市学院 实 验 报 告 纸 3 (3)销售量与广告费用之间的相关系数是多少? (4)写出估计的回归方程并解释回归系数的实际意义。 (5)检验线性关系的显著性(a=0.05)。
5. 随机抽取7家超市,得到其广告费支出和销售额数据如下 超市 广告费支出/万元 销售额/万元 A 1 19 B 2 32 C 4 44 D 6 40 E 10 52 F 14 53 G 20 54
(1) 用广告费支出作自变量 ,销售额为因变量 ,求出估计的回归方程。 (2) 检验广告费支出与销售额之间的线性关系是否显著(a=0.05)。 (3) 绘制关于 的残差图,你觉得关于误差项 的假定被满足了吗? (4) 你是选用这个模型,还是另寻找一个该更好的模型?
6. 一家电气销售公司的管理人员认为,每月的销售额是广告费用的函数,并想通过广告费用对月销售额作出估计。下面是近8个月的销售额与广告费用数据
月销售收入y(万元) 电视广告费用 (万元) 报纸广告费用 (万元)
96 5.0 1.5 90 2.0 2.0 95 4.0 1.5 92 2.5 2.5 95 3.0 3.3 94 3.5 2.3 94 2.5 4.2 94 3.0 2.5 (1)用电视广告费用作自变量,月销售额作因变量,建立估计的回归方程。 (2)用电视广告费用和报纸广告费用作自变量,月销售额作因变量,建立估计的回归方程,并说明回归系数的意义。 (3)上述(1)和(2)所建立的估计方程,电视广告费用的系数是否相同?对回归系数分别解释。 (4)根据(1)和(2)所建立的估计方程,说明它们的R2的意义。 浙江大学城市学院 实 验 报 告 纸 4 7. 某农场通过试验取得早稻收获量与春季降雨量和春季温度的数据如下 收获量y (kg) 降 雨 量x1 (mm) 温 度x2 ( ) 2250 25 6 3450 33 8 4500 45 10 6750 105 13 7200 110 14 7500 115 16 8250 120 17 建立早稻收获量对春季降雨量和春季温度的二元线性回归方程,并对回归模型的线性关系和回归系数进行检验(a=0.05),你认为模型中是否存在多重共线性?
8. 一家房地产评估公司想对某城市的房地产销售价格(y)与地产的评估价值(x1 )、房产的评估价值(x2 )和使用面积(x3 )建立一个模型,以便对销售价格作出合理预测。为此,收集了20栋住宅的房地产评估数据如下:
房地产编号 销售价格y(元/㎡) 地产估价(万元) 房产估价(万元) 使用面积(㎡)
1 6890 596 4497 18730 2 4850 900 2780 9280 3 5550 950 3144 11260 4 6200 1000 3959 12650 5 11650 1800 7283 22140 6 4500 850 2732 9120 7 3800 800 2986 8990 8 8300 2300 4775 18030 9 5900 810 3912 12040 10 4750 900 2935 17250 11 4050 730 4012 10800 12 4000 800 3168 15290 13 9700 2000 5851 24550 14 4550 800 2345 11510 15 4090 800 2089 11730 16 8000 1050 5625 19600 17 5600 400 2086 13440 浙江大学城市学院 实 验 报 告 纸 5 18 3700 450 2261 9880 19 5000 340 3595 10760 20 2240 150 578 9620 用SPSS进行逐步回归,确定估计方程,并给出销售价格的预测值及95%的置信区间和预测区间。
9. 为分析某行业中的薪水有无性别歧视,从该行业中随机抽取15名员工,有关的数据如下 月薪y(元) 工龄 性别(1=男,0=女)
1548 3.2 1 1629 3.8 1 1011 2.7 0 1229 3.4 0 1746 3.6 1 1528 4.1 1 1018 3.8 0 1190 3.4 0 1551 3.3 1 985 3.2 0 1610 3.5 1 1432 2.9 1 1215 3.3 0 990 2.8 0 1585 3.5 1 进行回归并对结果进行分析。 四、实验数据记录与分析
(基本要求:1.根据题号顺序记录软件输出结果并分析;2.结果可来自对SPSS或Excel进行操作的输出,二选一即可。) 1、(1)浙江大学城市学院 实 验 报 告 纸
6 由图可知,产量与生产费用呈正线性相关 (2) 相关性 产量 生产费用 产量 Pearson 相关性 1 .920** 显著性(双侧) .000 N 12 12 生产费用 Pearson 相关性 .920** 1 显著性(双侧) .000 N 12 12 **. 在 .01 水平(双侧)上显著相关。 产量与生产费用之间的线性相关系数为0.0920,显著相关 2、(1)浙江大学城市学院 实 验 报 告 纸
7 相关性 人均GDP 人均消费水平 人均GDP Pearson 相关性 1 .998** 显著性(双侧) .000 N 7 7 人均消费水平 Pearson 相关性 .998** 1 显著性(双侧) .000 N 7 7 **. 在 .01 水平(双侧)上显著相关。
人均GDP与人均消费水平呈正线性相关,相关系数为0.998
(2)