当前位置:
文档之家› 统计学一元线性回归课后习题答案课堂
统计学一元线性回归课后习题答案课堂
1
x与y的简单相关系数是 0.9489,两 变量之间呈现高度正相关关系
13
(3)利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义 最小二乘估计:y^ = ?^0+ ?^1 xLeabharlann { 将表中数据代入公式得:
=0.003585
=0.118129
∴y=0.118129 + 0.003585x
y关于x的回归方程为 y=0.118129 +
运送时间y 3.5 1.0 4.0 2.0 1.0 3.0 4.5 1.5 3.0 5.0
(1)绘制运送距离和运送时间的散点图,判断二者之间的关系形 态 (2)计算线性相关系数,说明两个变量之间的关系强度。 (3)利用最小二乘法求出估计的回归方程,并解释回归系数的实 际意义。
11
(1)绘制运送距离和运送时间的散点图,判断二者之间的关系形态
根据显著性水平 ? =0.05,查t分布表得t???(n2)=2.2281 由于?t?=7.435453> t???(12-2)=2.2281 , 拒绝H0,产量与生产费用之间存在着显著的正线性
相关关系 5
11.2 学生在期末考试之前用于复习的时间(单位:小时)和考 试分数(单位:分)之间是否有关系?为研究这一问题,一位 研究者抽取了由8名学生构成的一个随机样本,取得的数据如 下:
30 35
关
复习时关间
系
复习时间和考试分数存在正的线性相关关系
系列1 40
7
(2)计算相关系数,说明两个变量之间的关系强度。
r?
n? xy ? ? x? y
n? x2 ? ?? ?x 2 ? n? y2 ? ?? ?y 2
r?
8(20*64 ? 16*61 ? ... ? 22*77) ? (20 ? 16 ? ... ? 22)*(64 ? 61 ? ... ? 77)
表示实际值与估计值之间的差异程度是 0.5
10
11.5一家物流公司的管理人员想研究货物的运输距离和运输时 间的关系,为此,他抽出了公司最近10个卡车的运货记录的随 机样本,得到运送距离(单位:km)和运送时间(单位:天) 的数据如下表:
运送距离x 825 215 1070 550 480 920 1350 325 670 1215
r?
12(40*13?042*15?0...?140*185?)(40? 42?...?140)*(13?0150? ...?185)
12*(420? 422 ?...?1402)??20?16?22?2 ? 12*(1320?1502 ?...?185)?(130?150?...?1852)
r=0.9202
(1)绘制产量与生产费用的散点图,判断二者之间的关系形态。
产量与生产费用
200
180
160
140
120
用 费
100
80
系列1
60
40
20
0
0
20
40
60
80
100
120
140
160
产量
产量和费用存在正的线性相关系数
3
2)计算产量与生产费用之间的线性相关系数。
r?
n? xy? ? x? y
n? x2 ? ?? ?x 2 ? n? y2 ? ?? ?y 2
4
(3)对相关系数的显著性进行检验( ? =0.05),并说明二者之 间的关系强度。
1、提出假设: H0:? ? ? ;H1:? ? 0
2、计算检验的统计量
t ? r n ? 2 ~ t(n ? 2) 1? r2
t ? 0.9202
12 ? 2 1? 0.9202 2
? 7.435453
t???(12-2)=2.2281
8*(20 2 ? 162 ? ... ? 222 ) ? ?20 ? 16 ? ... ? 22?2 ? 8*(64 2 ? 612 ? ... ? 772) ? (64 ? 61 ? ... ? 77)2
r=0.8621
8
11.3、根据一组数据建立的线性回归方程 要求:
?? 1)解释截距 0的意义。 ?? 1)解释斜率 1的意义。
R2 ? SSR ? SSR ? 36 ? 0.9 SST SST ? SSE 40
回归直线对观测值的拟合程度为0.9,说明变量Y的 变异性中有90%是由自变量x引起的。
2)计算估计标准误差se 并解释其意义
n
? se ?
?yi ? y?i ?2
i?1
?
SSE ?
4 ? 0.5
n? 2
18 ? 2 16
一元线性回归课后习题讲解
--------第九组
1
11.1 从某一行业中随机抽取 12家企业,所得产量与生产费用的数据如下:
企业编号
产量(台) 1 2 3 4 5 6 7 8 9 10 11 12
生产费用 40 42 50 55 65 78 84 100 116 125 130 140
130 150 155 140 150 154 165 170 167 180 175 185 2
复习 时间X
考试 分数Y
20 16 34 23 27 32 18 22 64 61 84 70 88 92 72 77
6
要求:(1)绘制复习时间和考试分数的散点图,判断二者之 间的关系形态。
100
90
80
70
60
数 分
50
40
30
20
10
0
0
复
习
时
间
和
考
试
分
数
存
在
正
的
线
性
5
10
15 20 相 25
2)当=6时的E(y)
y? ? 10 ? 0.5x?
1)表示在没有自变量X的影响时其他各种因素对因变 量Y的影响为10 2)斜率的意义在于:自变量X变化对Y影响程度。回 归方程中,当x增加一个单位时,y将减少0.5个单位。 3)x=6时,代入方程,则,y=10-0.5 6=7
9
11.4 设SSR=36,SSE=4,n=18 要求:1)计算判定系数R^2并解释其意义
6.0
5.0 ) 天 4.0 ( 间 3.0 时 送 2.0 运
1.0
0.0 0
200
400
600
800 1000 1200 1400 1600
运送距离(公里)
根据图表显示,二者可能存在正线性相关关系
12
(2)计算线性相关系数,说明两个变量之间的关系强度
运送距离x 运送时间 y
运送距离 x
1
运送时间y 0.94894
0.003585x 表示运输距离每增加 1公里,
运送时间平均增加 0.003585天。
14
? 11.6 下面是7个地区2000年的人均国内生产总值 (GDP)和人均消费水平的统计数据:
地区
北京 辽宁 上海 江西 河南 贵州 陕西