当前位置:
文档之家› 我国城镇登记失业率的数学模型与预测
我国城镇登记失业率的数学模型与预测
2ö
∑(αi - α∗i ) yi + ∑ (αi - α∗i ) εi ∑(αi - α∗i ) = 0
i=1 l
s.t
K ( x i, y i) = e
.
下面介绍核主成分分析加权支持向量的预测 方法与步骤. 算法 1: 1) 已知样本集 T =
0 α i, α∗ i C i, i = 1,⋯, l 得到最优解 α i,α∗ i, i = 1,⋯, l .
四个主成份进行后面的加权支持向量机, 加权支持 向量基中选用的核函数为高斯径向基函数核
k( x i, x j) = exp - x i - x j /σ 2 ,
所用参数: 测试结果见表 2.
(
)
由上表可以看出, 基于核主成份与加权支持向
得到需要的预测值.
i=1
(
)
量机的预测方法拟合及预测都取得了很好的效果, 最小的相对误差 0.07% (1997 年) , 最大相对误差 4.13% (2001) .
第 23 卷第 4 期 2010 年 12 月
Journal of Hainan Normal University (Natural Science)
海南师范大学学报 (自然科学版)
Vol.23No.4 Dec.2010
我国城镇登记失业率的数学模型与预测
(海南师范大学 数学与统计学院, 海南 海口 571158) 摘 要: 结合中国国家统计局的数据, 使用基于核主成分分析与加权支持向量机的方法建立 模型, 找出了影响就业 (失业) 的 22 个主要指标. 考虑到这些指标相互之间的相关性, 使用核主成 分分析与加权支持向量机的方法建模, 给出了算法的步骤, 构造了非线性预测函数, 并对 1995-2009 年的城镇登记失业率进行拟合预测, 得到的结果具有较高的精度. 关键词: 失业率; 核主成分; 支持向量机 中图分类号: O 29 文献标识码: A 文章编号: 1674-4942 (2010) 04-0372-03
k = 1,⋯, l ) 征提取后的维数, . C 0 = 100, ε 0 = 0.01, β = 0.01, γ = 7) 取初值:
0.01, 由公式:
C i = C 0 ∙e l , i = 1,⋯, l (2) ∙l ε i = ε 0 ∙e γ , i = 1,⋯, l (3) i 8) 选择新的核函数, 这里选用 Guass 径向基函
{( x , y ),…( x , y )}
1 1 l l
9) 构造函数预测函数 l - x x f ( x) = ∑ α i - α∗ i K ( i, ) + b ,
i=1
(
)
其中 x k ∈ χ = {x1,⋯x l} = R N ,x k ∈ R, k = 1,⋯, l . (1) 的样本计算 l × l 的矩阵 K ij . 2) 选择一个核函数 K = (1 + x i ∙x j)3 , 利用选择
表 1 核主成份计算结果 Tab.1 Kernel principal component results λ 贡献率 累积率 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 λ 0.0001 0.0002 0.0003 0.0026 0.0219 14.3943 0.0512 贡献率 0 0 0 0.0002 0.0015 0.0035 0.9947 累积率 0 0 0 0.0002 0.0017 0.0053 1
Component Analysis and Kernel Weighted Support Vector Machine method to build the mathematical model.We found 22 key indicators which affect the employment (unemployment). Taking into account of the correlation among these indi⁃ cators, we used the Kernel Principal Component method analysis and Weighted Support Vector Machine method to build ban unemployment rate during 1995-2009 to fit the predicted results and obtain high accuracy. the model and give the algorithm on how to construct a non-linear prediction function, and also we used the registered ur⁃
ˉ = K - Ll K - KLl + 3) 根据矩阵 K ij 由公式 K
其中 b 按下式计算: l - x x b = y j - ∑ α i - α∗ i K ( i, j) - ε i , i=1 当 0 αi Cj ; l - x x b = y j - ∑ α i - α∗ i K ( i, j) + ε i ,
收稿日期: 2010-05-21
增就业 900 万人以上, 城镇登记失业率控制在 4.6%
结合国家统计局的数据, 从宏观层面、 中观层 面以及中央宏观调控政策做定性与简单定量分析, 对各项经济指标进行归纳、 汇总. 采用冗余变量检 验法, 最终确定了 22 个作为影响就业的主要指标:
第4期
杨帅国等: 我国城镇登记失业率的数学模型与预测
æ x x ç- i - j ç 2σ 2 ç è
Ll LK l , 其中 Ll 是一个 l × l 的常数矩阵, . ( Ll )ij = 1 l 4) 计算 K 的特征值 λ 与特征向量 α , 其中特 k 征值 λk 对应的特征向量 α . 并对特征向量进行规 范化处理, 设规范化以后的特征向量为 α ′ , 计算公 α α′ = 式为: . λ 5) 根据实际需要, 选取部分贡献值比较大的特
征值及其对应的特征向量构成新的空间作为低维 投影空间 (达到降维的目的) . l 6) 利用公式 ∑ α 'ik K ( x i, x), k = 1,⋯, p, p 计算
i=1
所有样本在选出的特征向量上的投影, 从而对所有 样本进行了非线性特征提取. 为了方便, 特征提取 n 后的数据仍用向量 x 表示, 即 x k ∈ R ( n p 为特
资计划, 确定了十大产业振兴计划, 采取扩大国内 消费需求的措施, 提高对外开放水平以增加出口. 同时, 中央财政拟投入 420 亿元资金实施积极的就
中央从 2008 年 10 月开始实施了 4 万亿元的投
1 分析问Leabharlann 并建立模型2010 年上半年的我国就业前景进行预测.
业政策. 2009 年我国在就业方面的目标是城镇新
( (
) )
i=1
374
当 0 αi Cj ;
海南师范大学学报 (自然科学版)
2010 年
10) 对于一个新样本 TC = {t1,⋯t m} 定义两个 矩阵 KC 和 K C , 其中 KC ij = (1 + t i ∙x j)3 K C ij = K - 1 l' K - K1 l + 1 l' K1 l 其 中 ,1 l' 为 m × l 矩 阵 ,(1 l' ) ij = 1/l . 利 用 式 l ∑α'ik K ( xi, x), k = 1,⋯, p 计算在选出的特征向量
本文利用近年来我国有关的统计数据并结合
一年多来我国国民经济的运行数据就城镇登记失 业率做了如下研究. 主要因素或指标. 1) 对有关统计数据进行分析, 寻找影响就业的 2) 建立城镇登记失业率与上述主要因素或指 3) 利用所建立的关于城镇登记失业率的数学
标之间联系的数学模型.
模型, 根据国家的有关决策和规划对 2009 年及
YANG Shuaiguo, HU Xiaohua, ZHU Donghe
Key words: unemployment; Kernel Principal Component; Support Vector Machine 失业、 经济增长和通货膨胀为宏观经济中特别 重要的三个指标, 按照已有的研究, 就业可以定义 为三个月内有稳定的收入或与用人单位有劳动聘 用关系. 失业的统计方法各国差异较大, 我国采用 业人数与城镇登记失业人数之和的比. 其中, 城镇 龄内 (16 岁以上及男 50 岁以下、 女 45 岁以下) , 有 一定的差异, 有些历史数据也较难获得. 城镇登记失业率, 是指城镇登记失业人数同城镇从 登记失业人员是指有非农业户口, 在一定的劳动年 劳动能力, 无业而要求就业, 并在当地就业服务机 构进行求职登记的人员. 由于统计口径不同, 存在 以内[1].
β∙i
数 :K ( x i, y i) = e 型: min 1 ∑ 2 i=1
l i=1 l
æ x x ç- i - j ç 2σ 2 ç è
ö÷÷
÷ ÷ ø
2
, 由下面非线性优化模
∑(αi - α∗i )(αj - α∗j ) K ( xi, x j) i=1 l i=1
l
÷÷
÷ ÷ ø
杨帅国, 胡晓华, 朱冬和
The Mathematical Model and Prediction in China's Urban Registered Unemployment Rate
(College of Mathematics and Statistics, Hainan Normal University, Haikou 571158, China) Abstract: In this paper, combining with the date of China's National Bureau of Statistics, we used the Kernel Principal