装订线食品价格变动分析摘要本文在综合考虑不同地域的食品价格的基础上,分析了食品价格变动的特点、未来一段时间食品价格的预测以及食品价格与CPI的关系。
针对问题一,我们首先将数据进行无量纲化处理,利用关联分析计算出各食品价格间的相关度;然后利用Q型聚类分析模型结合欧氏最短距离,将总体27种食品分为了6大类;最后,分别作出这6大类食品价格随时间变化的折线图,分析出食品价格波动的特点。
针对问题二,我们利用了 GM(1,1)灰色预测模型。
先进行数据的检验与处理,对原始数据进行一次累加,使数据有较强规律性,进而建立灰微分方程;再用最小二乘法,求解模型,利用所得的函数对六类食品的均价走势进行拟合,并依次进行残差检验与级别偏差检验,均有ε(k) < 0.1,ρ(k) < 0.1,达到了较高的精度要求,拟合效果很好;最后,通过拟合函数预测2014年5月份食品价格走势。
针对问题三,我们先计算出食品、衣着、住房价格等居民格方面的消费价格与CPI的关联度,通过关联度,可以确定食品价格对CPI有着剧烈的影响,因此进一步检测以确定食品的价格是否可以用来预测CPI;然后,在对所涉及到的食品进行分类和分析各类食品价格走势的基础之上,结合了两个城市——与——食品价格的数据,用多元线性回归分析求解出样本回归方程,作为总体回归方程的估计;模型的检验,用多重决定系数2R检验拟合程度,用F检验观测显著性,均达到了较高的精度;最后,根据求解出的回归方程,发现用的少量食品价格预测CPI 时,达不到最低的精度要求,误差很大,因此对于来讲,不能仅通过已知的少量食品价格来预测CPI;而对于来讲,其拟合函数有较高的精度,可以通过少量食品价格来准确预测2014年5月份居民消费价格指数CPI。
最后是模型的评价与推广。
其中,利用关联分析模型和聚类分析模型来解决分类问题很合理,基于最小二乘法的多元线性回归方程拟合具有良好的精度与可信度,能够得到不错的预测结果,具有较强实用和推广价值。
关键词:关联分析模型 Q型聚类分析 GM(1,1)灰色预测多元线性回归分析一、问题重述1.1 问题背景食品价格是居民消费价格指数(CPI)的重要组成部分,食品价格波动直接影响居民生活成本和农民收入,是关系国计民生的重要战略问题。
在收入增长缓慢的情况下,食品价格上涨将使人民群众明显感到生活成本增加,特别是食品价格上涨将降低低收入群体的生活质量。
1.2 问题提出根据已知的信息,建立数学模型解决以下问题:(1)根据附件以及相关统计的数据,分析我国食品价格波动的特点。
(2)对2014年5月份食品价格走势进行预测。
(3)目前统计部门需要监测大量食品价格变动情况以计算居民消费者价格指数变动情况,能否仅仅通过监测尽量少的食品种类(这里,食品种类是指附件1表格中的商品名称,可以认为每一种商品名称即为一种食品种类)价格即能相对准确地计算、预测居民消费者价格指数?在同样精度要求下,不同地区所选取的食品种类以及种类数目是否一致?请至少选择两个有特点的城市进行说明。
二、模型假设1)收集到的相关的数据都准确可靠,可信度高;2)食品零售价格每十天的平均价格与食品日平均价格的偏差很小,可以忽略不计;3)食品的分类是按价格走势来划分的,同一类的食品价格的变化幅度可能有所不同,假设只要满足相同的价格走势即可;4)假设在预测时间段不存在经济发展状况、突发情况(如自然灾害)等能使食品价格波动显著的因素。
三、符号说明0x :一组数列中的参考数列; ix :一组数列中的比较序列;()i k ξ:是比较数列i x 对参考数列0x 在k 时刻的关联系数;1()1ni k k r n ξ==∑:为数列i x 对参考数列0x 的关联度;d :欧式距离;(0)i x :时间序列的原始数据(1)i x :对原始数据进行一次累加后的数据()k ε:相对误差()k ρ:级比偏差四、问题一4.1 问题分析该问题要求根据已知的统计数据,分析出我国食品价格波动的特点。
因此,从题目的要求可以看出,食品的价格是我们所要分析研究的对象。
但由于已知的食品种类有27种,数据量比较庞大,如果逐个地分析每一种食品的价格波动情况,势必导致过程繁琐,无概括性与简洁性。
因此可以先对27种食品进行分类,分类的依据是各食品价格间的关联程度。
由于每一类中的食品价格均具有相同的走势,因此可以逐类分析,即可得出我国食品价格的波动情况。
4.2 建立模型Ⅰ——关联分析模型①用附表1中的数据, 建立矩阵:()()(){}12271,2,,10,1,2,,10,,1,2,,10TA x x x = ,则(){}()()()()|k 1,2,,101,2,,10i i i i i x x k x x x === ,(i=1,2, (27)表示27种食品中某一种食品在给定时间段没十天的平均价格。
根据灰色系统理论中的关联分析理论,选取参考数列:(){}()()()()00000|k 1,2,1,2,,x x k n x x x n ===,,其中k 表示时刻。
假设有m 个比较数列(){}()()()()|k 1,2,1,2,,i i i i i x x k n x x x n ===, ,(i=1,2,…,m ) 则称0000()()|()()|()()|()()|()min min |max max |1|max max |s s sssti s s stt t t t t t t t k x x x x x x x x ρρξ-+--+-=()是比较数列i x 对参考数列0x 在k 时刻的关联系数,其中p (在区间[0,1]中)为分辨系数,称一式中的0()()|min min |s sst t x x -,0()()|max max |s stt t x x -分别为两级最小差与两级最大差。
一般来讲,分辨系数ρ 越大,分辨率越大;ρ 越小,分辨率越小。
(1)式定义的关联系数是描述比较数列与参考数列在某时刻关联程度的一种指标,由于各个时刻都有一个关联数,因此信息显得过于分散,不便于比较,为此我们给出定义3 称:1()12ni k k r n ξ==∑ ()为数列i x 对参考数列0x 的关联度。
综合以上所述,可以建立食品价格走势的关联分析模型——模型Ⅰ:00001()()|()()|()()|()()|()()min min |max max ||max max |31s s ss s ti s s s t ni k t t t t t t t t k k x x x x x x x x r n ρρξξ=-+--+-⎧=⎪⎪⎨⎪=⎪⎩∑ ()②模型的求解与结果根据附表提供在2014.1.1-2014.4.10时间段的27种城市居民食品零售价格,以各种食品每十天的均价作为参考原始数据,通过MATLAB 实现式(3)的程序运算,得到关联度矩阵R ,部分结果显示如下表(程序代码见附录1,关联度完整矩阵见附录2):表1.各食品间的部分关联度数据表4.3建立模型Ⅱ——Q 型聚类分析模型①在本模型中,采用精度较高的最短距离聚类法,计算各相关度的距离时采用欧式距离:(4)d =最短距离聚类法是在原来的m×m距离矩阵的非对角元素中找出 ,把分类对象Gp 和Gq 归并为一新类Gr ,然后按计算公式{}min ,(,)rk pk qk d d d k p q = ≠ (5)计算原来各类与新类之间的距离,这样就得到一个新的(m -1)阶的距离矩阵;再从新的距离矩阵中选出最小者ij d ,把Gi 和Gj 归并成新类;再计算各类与新类的距离,这样一直下去,直至各分类对象被归为一类为止。
这样,就可以作出动态聚类图,在根据聚类图将27种食品根据价格走势的近似程度分为若干类。
②模型Ⅱ的求解与结果附表当中总共列出了27种食物,现从第一种到最后一种依次编号为1-27,根据上述的Q 型最短距离法聚类法的算法步骤,利用MTLAB 编写相关程序代码(见附1), 得到的聚类图以及将得出的结果加以整理如下:图1.聚类图由聚类图可知,按照均价走势的的不同特点,所涉及到的食品被分成了六类,他们分别是:一、豆角二、西红柿三、油菜、香蕉(国产)四、猪肉后臀尖(后腿肉)、五花肉五、大米(粳米)、面粉(富强粉)、面粉(标准粉)、豆制品(豆腐)、花生油(压榨一级)、大豆油(5L桶装)、菜籽油(一级散装)、牛肉(腿肉)、羊肉(腿肉)、鸡(白条鸡)、鸡(鸡胸肉)、鸭(白条鸭)、鸡蛋(散装鲜鸡蛋)、活鲤鱼、活草鱼、带鱼、大白菜、芹菜、土豆、苹果(富士苹果)六、黄瓜4.4结果的分析与食品价格波动特点的情况为了进一步说明各种食品归类的合理性以及各类食品的均价走势特点,现结合各类食品的均价走势图加以更为直观的说明,由于第五类所包含的食品种类相对较多,各自选取其中几种食品的均价走势作图,而第一、类各自只包含一种食品,故只需作出每种食品的均价走势图即可,图走势及每类食品的特点如下:为了能直观地说明食品价格波动的情况,现依次作出这六大类食品价格变化的曲线图①图2.第一类食品价格走势该图由第一类食品中的豆角的平均价格走势构成,第一类食品有以下的特点:在2014.1.1到2014.1.30这段时间,食品价格持续增长;在2014.1.30到2014.2.10日这段时间,趋于平稳,略有下降;在2014.2.10到2014.4.10时间段,持续下降。
总的来说,这类食品先大幅增长,短暂平稳后,大幅下降,波动较大。
②图3.第二类食品价格走势该图由第二类食品中的西红柿的平均价格走势构成,有以下的特点:在2014.1月份价格持续增长;到二月份开始回落,在二月中旬达到小低谷后开始反弹;到三月份开始又呈大幅下降趋。
总的来说,这类食品价格有较大的波动。
③图4.第三类食品价格走势该图由第三类食品中的油菜和香蕉的平均价格走势构成,有以下的特点:在统计时间段,即2014.1.1到2014.4.10这段时间,略有变化,波动不大。
④图5.第四类食品价格走势该图由第四类食品中的猪肉后臀尖(后腿肉)、五花肉的平均价格走势构成,有以下的特点:在整个统计时间称明显的下降趋势。
⑤图6.第五类食品价格走势该图由第五类食品中的大米(粳米)、面粉(富强粉)、面粉(标准粉)、豆制品(豆腐)、花生油(压榨一级)、大豆油(5L桶装)、菜籽油(一级散装)、牛肉(腿肉)、羊肉(腿肉)、鸡(白条鸡)、鸡(鸡胸肉)、鸭(白条鸭)、鸡蛋(散装鲜鸡蛋)、活鲤鱼、活草鱼、带鱼、大白菜、芹菜、土豆、苹果(富士苹果)的平均价格走势构成,第五类食品有以下的特点:这类食品平均价格很平稳,在统计时间没有明显的波动。
⑥图6.第五类食品价格走势该图由第六类食品中的黄瓜的平均价格走势构成,有以下的特点:在2014.1月份价格持续增长;在二月初达到顶峰后开始逐渐回落。