数学建模案例分析
18:23
三、灰色关联分析
目的——研究GDP与其他经济指标间的关联紧密程度。 统计方法——灰色关联系数
18:23
灰色关联系数的计算步骤
数据规范化——剔除量纲影响
原始数据: xi (x i (1), x i (2), , x i (n))
处理后数据:
yi
( x i (1) x i (1)
,
PLS建模原理: 自变量集:(x1, x2 , , xp )因变量集:( y1, y2 , , yq ) 若最终提取r个主成份 t1, t2 , , tr , 偏最小二乘将通过建立 y1, y2 , , yq 与 t1, t2 , , tr 的回归式,然后再表示为 y1, y2 , , yq 与原自变量的回
max max y0
y0 k
k
yi
k
yi
k
18:23
灰色关联系数的计算步骤
计算关联度
n
ri i (k) i 1
18:23
灰色关联系数的计算步骤
案例计算结果: 以GDP为参考序列:
城镇收入>农村收入>三产比重>财政收入>二产比重 以财政收入为参考序列:
GDP>城镇收入>农村收入>三产比重>二产比重
GDP与产业结构匹配度建模步骤:
计算标准值和实际值之间的欧式距离,并归一化为(0,1)
年度
人均GDP (美元)
一产业
2007 2675 0.1151
标准值 二产业 0.3636
三产业 0.5213
一产业 0.129
实际值 二产业 0.476
三产业 0.395
(0.1151 0.129)2 (0.3636 0.476)2 (0.5213 0.395)2 / 2 0.119955
18:23
匹配度的计算步骤:
GDP与居民收入、财政收入匹配度建模思想:设匹配度量化取值为(0, 1),当相关指标占GDP的比例达到理想标准时,匹配度为0;但相关指标 占GDP比例为0时,匹配度为1;并设匹配度随指标比例在(0,1)上非 线性变动(二次函数曲线y a (x b)2 )。
18:23
一产业 0.129
实际值 二产业 0.476
三产业 0.395
18:23
匹配度的计算步骤:
GDP与产业结构匹配度建模步骤: 计算标准值和实际值之间的欧式距离,并归一化为(0,1)
三维空间两点a(x1,y1,z1)与b(x2,y2,z2)间的欧氏距离:
该距离的值域范围为0到 2
18:23
匹配度的计算步骤:
18:23
偏最小二乘(PLS)原理介绍
PLS建模原理: 建模步骤:
自变量 集:
(x1, x2 , , xp )因变量
集:
( y1, y2 , , yq )
在自变量集中提取第一主成份 t1 ,同时在因变量集中也提取第一主成 份 u1,要求 t1 和u1 相关程度达到最大;然后建立因变量 y1, y2 , , yq 与 t1 的回归,并判断精度;
Statistics
建模大赛案例分析
Topic
我国经济增长与经济结构、财政收入、居民收入关系之研究
18:23
我国经济增长与经济结构、财政收入 居民收入关系之研究
18:23
赛题要求
> 论证经济增长、经济结构、与财政收入、居 民收入的匹配度.
> 分析经济增长、财政收入、经济结构、与居 民收入之间关系变动的数量特征和趋势.
财政收入占比
5.3 4.9 5.5 7.1 5.6 6.6 9.8 6.9 9.2
城镇居民收入占比 1.8 1.6 1.0 1.4 1.2 1.0 1.6 1.3 1.0
农村居民收入占比 2.6 2.0 1.0 2.3 1.8 1.0 2.2 1.7 1.0
第三产业比重
35.4 31.7 33.3 41.7 37.3 40.0 41.7 34.6 36.7
18:23
Part Two 基本统计分析
18:23
一、定性分析
定性分析思路——对命题中四个经济指标的发展现状做描述性分析。 统计方法——统计图、统计表。
18:23
总体经济发展——经济增长和经济结构变动分析
400,000.00 300,000.00 200,000.00 100,000.00
50.5
18:23
匹配度的计算步骤:
GDP与产业结构匹配度建模步骤:
参阅国际匹配标准,拟合与我国GDP水平相匹配的产业结构标准值:
人均GDP 200 300
400
600
1000 2000
(美元)
第一产业比重 36 30.4
26.7
21.8
18.6
16.3
第二产业比重 19.6 23.1
25.5
29
18:23
偏最小二乘(PLS)原理介绍
PLS建模原理: 自变量 (x1, x2 , , xp )因变量 ( y1, y2 , , yq )
集:
集:
继续提取第二对主成份,获得 t2 和 u2 ,建立因变量 y1, y2 , , yq和 t1 t2 的回归,判断精度,如不满足继续提取。
18:23
偏最小二乘(PLS)原理介绍
31.4 33.2
第三产业比重 44.4 46.5
47.8
49.2
50
50.5
18:23
匹配度的计算步骤:
GDP与产业结构匹配度建模步骤:
参阅国际匹配标准,拟合与我国GDP水平相匹配的产业结构标准值:
60
50
y3 2.6 ln x 31.6
40
30
y2 6.0 ln x 11.0
20
10
y1 8.6 ln x 79.37
归方程式,即最终结果。
主成份 个数的选择方法——交叉有效性检验
18:23
偏最小二乘(PLS)原理介绍
交叉有效性检验 :——留一交叉验证
PRESS(h)
( yij yˆ(i) j (h))2
ji
越小越好
Q2h 1 PRESS(h) / SS(h 1) (1 0.95)2 0.0975
SS (h 1) 为所有样本拟合h-1各成分时的回归误差平方和
0.00
第一产业
第二产业
第三产业
GDP名义增长率
0.60000 0.40000 0.20000 0.00000 -0.20000 -0.40000
18:23
主要影响指标变动分析——财政收入 、居民收入
18:23
35.0%
GDP名义增长率 城镇人均可支配收入增长率
财政收入增长率 农村居民纯收入增长率
y0(1) yi (1) y0 (2) yi (2) y0 (n) yi (n)
max max
i
k
y0 (k)
yi (k)
18:23
min min
i)
灰色关联系数的计算步骤
计算各时刻关联系数
i
(k
)
min
min y0 y0 k
k
yi
yi
k
k
max max
偏最小二乘(PLS)原理介绍
知识链接——主成份分析:
主成份分析:就是用少数的几个综合指标来代表原来的多项指标,而且几 个综合指标之间是独立的。
x1
y1 a11x1 a12 x2 a1p xp 第一主成份
x2 y2 a21x1 a22 x2 a2 p xp 第二主成份
… ... …
0
0
500
1000
1500
2000
2500
第一产业比重
第二产业比重
第三产业比重
18:23
匹配度的计算步骤:
GDP与产业结构匹配度建模步骤: 参阅国际匹配标准,拟合与我国GDP水平相匹配的产业结构标准值:
年度
人均GDP (美元)
一产业
2007 2675 0.1151
标准值 二产业 0.3636
三产业 0.5213
18:23
偏最小二乘(PLS)原理介绍
偏最小二乘的特点: 可用于多变量对多变量建模 能在多重共线情况下进行建模 允许样本量小于自变量个数情形下的建模 最终模型包含所有变量,易于解释和辨识系统信息
18:23
偏最小二乘(PLS)原理介绍
建模原理: 偏最小二乘=主成份分析+典型相关+多元回归
18:23
匹配度的计算步骤:
GDP与居民收入、财政收入匹配度建模步骤:以收入为例
查阅文献得到居民收入的理想值为占GDP总量59.5%,得到二点: (0,1) 、(0.595,0)拟合曲线得方程组
1 a (0 b)2
0
a
(0.595
b)2
y 2.82466 (x 0.595)2
2008年城镇居民收入占比为0.263183,带入得到匹配度为0.311034
xp
yp ap1x1 ap2 x2 app xp
18:23
(各成分间独立,且按包含原指标信息量排
偏最小二乘(PLS)原理介绍
知识链接——典型相关分析:
典型相关分析:找到两组变量间联系,通过一组变量的线性组合与另一组
变量线性组合的关联关系来体现。
x1
a11x1 a12 x2 a1p xp
x2 a21x1 a22 x2 a2 p xp
……
第一对典型变量
U1
V1
U V 第二对典型变量
2
2
b11 y1 b12 y2 b1q yq
y1
b21 y1 b22 y2 b2q yq
y2
……