当前位置:
文档之家› 经济管理决策分析方法第三章-回归分析
经济管理决策分析方法第三章-回归分析
10
5
残差
500
1000
1500
2000
2500
0 6.000 -5 -10
6.500
7.000 U=LN(X)
7.500
8.000
22
【例5-7】
就例5-2 Northwind Trader公司的销 售额数据,进行非线性回归分析,并预测96年6月 和7月的销售额。
月销售额变化及三次多项式拟合曲线
19
通过变量替换把问题转化为一元或多元线性
回归问题后,用线性回归分析的方法建立回 归模型,并进行预测。 非线性回归使用规划求解工具时求解的是非 线性规划问题,选取不同的初值可能会有不 同结果,收敛到局部极值,应该尝试不同的 初值,以便求出全局最优解。
20
【例5-6】
某企业想了解公司某种产品的产量与 收益之间有何关系,为此收集整理了历年的产 量、收益数据资料,如下表所示。试根据这些资 料建立适当模型说明产量与收益之间的关系。
X
25
对数函数 Y a b ln X
设 U ln X 则 Y a bU
Y Y
O (b> 0)
X
O (b< 0)
X
26
双曲线函数 1 设 U X 则 Y a bU
Y Y
1 Y ab X
a O
X
a 7
二次多项式及三次多项式
0 0 2 4 6 8 10 12
年
14
29
A. 皮尔(R.Pearl)模型
Y K 1 e
f ( x)
K为常数(表示承载能力,如某种产品的市场状态容量)
f (x) a0 a1x a2 x
2
an x
n
又称logistic function or logistic curve
多元线性回归模型的一般形式
Y a b1 X 1 b2 X 2 ... bk X k
多元线性回归预测步骤
第一步,获得候选自变量和因变量的观测值; 第二步,从候选自变量中选择合适的自变量, 第三步,确定回归系数,判断回归方程的拟合优度; 第四步,根据回归方程进行预测。
1 2 3 4 5 6 7 3 8 12 10 25 14 18 8 9 10 11 12 13 36 32 57 70 115 150
年销售额的指数拟合结果
年销售额Y 160 140 120 100 80 60 40 20 年销售额估计值
初值:a=2,b=1 全局最优 初值:a=1,b=1 局部最优
F
统计量
对于多个自变量,如果其F统计量的P值小于显著水平 (1-置信度),则可认为方程的回归效果显著。
10
回归预测的步骤
第一步,获取自变量和因变量的观测值;
第二步,绘制XY散点图;
第三步,写出带未知参数的回归方程; 第四步,确定回归方程中参数值; 第五步,判断回归方程的拟合优度; 第六步,进行预测。
18
89 78 70 60 69 52 45 56 32 45
非线性回归分析方法就是用一条曲线来拟合因变
量对于自变量的依赖关系。根据问题的性质,拟 合曲线可以是指数曲线、对数曲线、幂曲线以及 多项式曲线等。具体采用何种曲线主要由两方面 的因素决定。一方面就是自变量与因变量之间本 来就存在着一种内在函数依赖关系,而这种依赖 关系是分析者根据自己的知识背景和经验已经了 解的。另一方面,根据由自变量和因变量观测值 作出的散点图,可以看出它们之间的依赖关系。
9
回归模型的检验
判定系数
R2
用来判断回归方程的拟合优度。 通常当R2大于0.9时,所得到的回归直线拟合得较好, 而当R2小于0.5时,所得到的回归直线很难说明变量之 间的线性依赖关系。
t
统计量
对于某个自变量,如果其t统计量的P值小于显著水平 (1-置信度),则可认为该自变量与因变量是相关的。
产量(X) Residual Plot
10
50
45 40 35 30 25 20 15 10 5 0 0
收益与产量线性拟合结果
y = 0.0196x - 2.0861 R² = 0.8482
残差
0
0 -10 500 1000 1500 2000 2500
产量(X)
U=LN(X) Residual Plot
2
回归分析的概念
回归分析原理简介
回归模型的检验 回归预测的步骤与方法
3
回归分析方法 一种建立统计观测值之间的数学关系的方法;
通过自变量的变化来解释因变量的变化,从而由自
变量的取值预测因变量的可能值。
自变量与因变量的相关关系
a. Y与Xk 正线性相关 b. Y与Xk 负线性相关 c. Y与Xk 不相关
试根据这些数据建立回归模型。然后再进一步根据回归方程预测一个区内 大学生人数为1.6万的店铺的季度销售额。
12
匹萨店季度销售额与学生人数关系图
25
20
销售额(万元)
15
10
5
0 0 0.5 1 1.5 2 2.5 3
学生数(万人)
13
产品需求量 人均收入 580 56 489 53 620 60 680 68 710 75 890 83 900 88 810 83 999 98 980 14 110
产量X 473 639 741 824 874 914 939 956 972 1024 1055 1056 1132 收益Y 1.47 7.94 7.28 6.55 9.18 16.67 14.9 14.91 15.81 19.63 17.41 17.42 22.51 产量X 1467 1474 1493 1523 1242 1568 1607 1611 1642 1673 1499 1703 1766 收益Y 30.35 27.46 32.26 33.75 25.26 29.42 34.03 30.17 28.56 29.2 32.32 30.24 37.07 产量X 1136 1075 1240 1253 1281 1285 1319 1366 1403 1407 1443 1457
140000.00 120000.00 100000.00 y = 40.367x3 - 1147.7x2 + 10921x + 11636 R² = 0.9046
销售额
80000.00 60000.00 40000.00 20000.00 0.00 0 5 10 月序号 15 20 25
23
幂函数 Y aX b
21
收益Y 15.39 22.53 24.58 27.93 24.51 20.55 23.31 27.01 30.3 29.52 29.39 32.36
产量X 1771 1837 1868 1884 1973 2021 2066 2154 2178 2249 2305 2235
收益Y 32.54 37.15 33.59 29.95 36.34 32.89 36.14 32.52 38.5 38.25 41.24 36.49
11
【例5-1】 “阿曼德匹萨”是一个制作和外卖意大利匹萨的餐饮连锁店, 其主要客户群是在校大学生。为了研究各店铺销售额与店铺附近地区大学 生人数之间的关系,随机抽取了十个分店的样本,得到的数据如下:
ê Æ µ Ì ± à º Å 1 2 3 4 5 6 7 8 9 10 ø Ú Ç Ä ´ ó Ñ §É ú Ê ý ¨Í £ ò È Ë £ © 0.2 0.6 0.8 0.8 1.2 1.6 2 2 2.2 2.6 ¼ ¶ ¾ È Ï ú Ê Û ¶ î ¨Í £ ò Ô ª £ © 5.8 10.5 8.8 11.8 11.7 13.7 15.7 16.9 14.9 20.2
16
该企业的管理人员试图根 据这些数据找到销量与其他 两个变量之间的关系,以便 进行销量的预测并为未来的 预算工作提供参考。试根据 这些数据分析一下,建立何 种模型比较合适,如果未来 某月员工的薪酬为25万元, 平均户月收入为33.4千元, 预测该年的销量。
二元线性回归方程:
Y ' 105.44 5.93X 1 8.65X 2
L XY b L XX
a y bx
相关系数
相关系数是反映两变量间是否存在相关关系,
以及这种相关关系的密切程度的统计量 。
r
LXY LXX LYY
当| r |=1时,表示变量Xt与Yt完全线性相关; 当| r |=0时,表示变量Xt与Yt之间不存在线性相关关系; 当0<| r |<1时,表示变量Xt与Yt之间存在不同程度的线性 相关关系: 当0<| r |0.3时,为微弱相关; 当0.3<| r |0.5时,为低度相关; 当0.5<| r |0.8时,为显著相关; 当0.8<| r |1时,为高度相关。
回归分析的概念、相关性概念、最小二乘法,以及
回归模型的统计检验等基本原理。 Excel中的规划求解和回归分析报告等回归分析工具 的使用方法。 一元线性回归问题的各种分析方法。 利用规划求解工具解决一般非线性回归问题的方法。 多元线性回归问题的自变量筛选方法和多元线性回 归模型的建立方法。 利用规划求解工具解决一般非线性回归问题的方法。 将非线性问题变换成线性问题来求解的非线性回归 分析方法。
设 U ln X V ln Y 则 V ln a bU
Y
b>1
Y
a
b<1 a b>-1 b<-1 O 0
1 X
O
1
X
(b> 0)
24
(b< 0)
指数函数 Y aebX
设 V ln Y 则 V ln a (b ln e) X