数学建模预测模型与案例
(Ⅱ)数据的分析和处理
建模不仅需要大量的数据,同时数据必须可靠,并适合建模的要 求。这些数据虽然是历史的客观写照,但有可能是失真的数据。对于 失真的数据, 以及不符合建模的数据, 必须通过分析, 加以适当处理。
1.处理的原则
(1) 准确, 处理后的数据能正确反映事物发展的未来趋势和状况;
(2)及时,数据的处理要及时; (3)适用,处理的数据能满足建模的需要; (4)经济,要尽量减少数据处理的费用,以降低预测成本; (5) 一致, 处理的数据在整个比较性。 使用期间内必须是一致的, 具有可比较性
3
采用第二手数据。 第二手数据多为已经公布和发表的资料,易于获取,代价低,数 据精度也有一定的保证。其缺点是数据可能不能直接适用于预测情 况。因此,常常需要对已公布的数据进行修正和处理,使其适应于预 测需要。 无论是第一手数据还是第二手数据,都可能是混乱的、无序的、 彼此间孤立的。预测人员都应将原始数据按“单元”或“类别”整理 和集中,以便使其成为内容上完整、有序、系统,形式上简明统一的 数据。
9
(6)代用品或近似代用品的产量和进口量; (7)与有关新投入的产品前后关联度高的产品的产量; (8)国家计划规定的产品或代用品的生产指标; (9)产品出口量; (10)个人或集体消费者们的实贯或嗜好; (11)法律方面的资料。
二 专家的选择和专家组的组成
在现实生活中,有时不得不在不确定的条件下作出决策,这是因 为或者决策的制约因素过多,或者其中某些因素无法度量。我们常称 之为定性因素。为这类决策提供预测,因为没有严格的理论依据,定 量方法无法采用。在这种情况下,借助专家的经验判断则有可能作出 定量方法难以得到的科学预测。专家的素质取决于他的知识、经验、 智慧和对未来的预测能力,以及其他一些因素。实践表明,在当今如 此复杂多变的情况下,任何个人或一个专家都难于作出较精确的预 测。必须集中多方专家的意见才能作出科学的预测。因此选择专家组 成员是预测能否成功的重要环节,是预测要做的首要工作。应邀的专 家要具有广泛的知识,对预测所涉及主题的各领域应有较深的造诣。 选择专家不能简单从事, 不能事先未经征得同意就将调查表发给拟邀 请的专家。因为有的专家可能不愿意参加这项预测。那么选择专家应 如何进行呢?
预
测
模
型
最近几年,在全国大学生数学建模竞赛常常出现预测模型或是 与预测有关的题目,例如疾病的传播,雨量的预报等。什么是预测模 型?如何预测?有那些方法?对此下面作些介绍。 预测作为一种探索未来的活动早在古代已经出现,但作为一门 科学的预测学,是在科学技术高度发达的当今才产生的。 “预测”是 来自古希腊的术语。我国也有两句古语: “凡事预则立,不预则废” , “人无远虑,必有近忧” 。卜卦、算命都是一种预测。中国古代著名 著作 “易经” 就是一种专门研究预测的书, 现在研究易经的人也不少。 古代的预测主要靠预言家,即先知们的直观判断,或是借助于某些先 兆,缺乏科学根据。预测技术的发展源于社会的需求和实践。20 世 纪初期风行一时的巴布生图表就是早期的市场预测资料, 哈佛大学的 每月指数图表为商品市场、证券市场和货币市场预测提供了依据。然 而这些预测都未能揭示 1929-1930 年经济危期的突然暴发,使工商界 深感失望。尔后,经济学家们从挫折中吸取了教训,采用趋势和循环 技术对商业进行分析和预测,科学预测也因此开始萌生。20 世纪 30 年代凯思斯提出政府干预和市场机制相结合的经济模型,1937 年诺 依曼又提出了扩展经济模型,对近代经济模型产生重要的影响,科学 的经济和商业预测也就步入发展阶段。 技术预测开始于二次世界大战后的 20 世纪 40 年代,直到 20 世 纪 50 年代未才广泛应用于工农业和军事部门。由于社会、科学技术 和经济的大量需求,预测技求才成为一门真正的科学,预测未来是当
(Ⅲ)数据的内涵及数量
在预测过程中,由于预测对象不同,预测内容不同,以及预测期 限不同,所需的数据内涵及数量也不同。经济预测的数据主要包括: (1)国民经济总产值及各部类的分配情况; (2)各行业的生产规模和生产能力以及技术水平; (3)政府的经济政策及产业政策; (4)生产力布局; (5)人口发展趋势及就业情况; (6)国民经济投资及分配; (7)国际环境及变化趋势。 市场需求预测需要的数据主要有: (1)人口及人均收入; (2)国民收入的增长及分配情况; ; (3)与产品消费直接有关的政府政策和法规,如进口限制、进口 税、销售稅和其它税费、信贷管理及外费管理等。 (4)一段时期内产量和产值的生产能力; (5)一段时期内的产品的进口量;
1
代科学的重要任务。 20 世纪以来,预测技术所以得以长足进步,一方面,与社会需 求有很大关系,另一方面通过社会实践和长期历史验证,表明事物的 发展是可以预测的。而且借助可靠的数据和科学的方法,以及预测技 术人员的努力,预测结果的可靠性和准确性可以达到很高的程度,这 也是预测技术迅速发展的另一个重要原因。 科学技术、经济和社会预测的应验率也是很高的。维聂尔曾预言 20 世纪是电子时代,法国思想家迈希尔 18 世纪末到 19 世纪初对巴 黎未来几百年的发展进行了预测。从 1950 年的实际情况分析,他的 预测中有 36%得到证实,28%接近实现,只有 36%是错误的。法国 哲学家和数学家冠道塞在法国大革命时期曾采用外推法进行了一系 列社会预测,其中 75%得到证实。沙杰尔莱特 1901 年在《二十世纪 的发明》 一书中的一些预测, 其中 64%得到证实。 凯木弗尔特在 1910 年和 1915 年公布的 25 项预测中,到 1941 年只有 3 项未被证实,3 项是错误的。我国明朝开国功臣刘基就预测将来是天上铁鸟飞,地上 铁马跑,那时还没有火车、飞机。 预测的目的在于认识自然和社会发展规律, 以及在不同历史条件 下各种规律的相互作用,揭示事物发展的方向和趋势,分析事物发展 的途径和条件,使人们尽早地预知未来的状况和将要发生的事情,并 能动地控制其发展,使其为人类和社会进步服务。因而预测是决策的 重要的前期工作。决策是指导未来的,未来既是决策的依据,又是决 策的对象,研究未来和预测未来是实现决策科学化的重要前提。预测
6
例如,某一生产生产资料的大型企业,80 年代中期前销售额一直 呈递增趋势,而 80 年代中期后,受压缩基建规模的影响,销售量突 然下降。又如轿车在 80 年代中期以前一直是紧俏商品,后因国家实 行控购政策,销售量一度急剧下降。这时,对上述某一生产资料销售 量或对轿车销售量进行预测,都要考虑政策因素的影响,对于前期数 据采用比例法进行适当修正(当时是计划经济,私人买不起轿车。买 轿车的都国家机关、企事业单位。 ) 当然比例法不仅仅限于对数值向下调,也适合向上调。比例法数 据处理公式为
yl , ym 分别是与 xl , xm 相对应的因变量统计值
(4)拉平法 由于条件发生变化,常常使一些厉史数据不能反映现时的情况, 例如,大型钢铁厂、化肥厂、或油气田的建成投产或开发,可以使产 量猛增,这时历史数据将发生突变,出现一个转折,如用这类数据建 模,则需要处理。这时拉平法是一种较好的方法。它的原理是对转折 点前的数据加一个适当的量值,使其与折点后的数据走向一致。 (5)比例法 销售条件与环境的变化常常会引起一个企业产品市场销售比例的 改变。当比例变化较大时,说明销售条件与环境对销售的影响己超过 其他因素对销售的影响, 也说明以前的销售统计数据所体现出的销售 发展规律不再适用之于目前的情况了。 如果仍然利用这些数据建立预 测模型,将无法体现销售条件和环境变化后的销售量变化的规律,用 这样的模型进行预测,将会造成较大的误差。因此,如果还想利用这 些数据建立模型,进行预测,就应该把它们处理成能体现条件与环境 发生变化之后的情况的数据。对于这类数据,比例法就是一种比较有 效的处理方法。
(Ⅰ)数据的收集和整理
按时态分,数据可分为历史数据和现实数据;按预测对象分,可 分为内部数据和外部数据;就收集的手段分,可分为第一手数据和第 二手数据。 第一手数据,包括以各种形式初次收集的数据。收集第一手数据 的途径包括:抽样调查,连续调查,或全面调查。在预测的定性方法 中常常需要第一手数据, 例如特尔斐法的第一个阶段就是收集第一手 数据。由于获取第一手数据的费用较高,时间较长,所以定量方法常
2.处理方法
(1)判别法
4
通过对历史数据的判断,选择其中可代表整个预测过程中很可能 发生的模式的数据作为建模数据; (2)剔除法 如果数据量比较大,且非必须具备连续的数据量,这时可剔除数 据中受随机干扰的异常值; (3)平均值法 在数据比较少或需要连续数据时,则可采取平均值法对数据进行 处理。 对于时间序列数据,可用异常值前后两期数据的算术平均值或几 何平均值对异常值进行修正,即
yt −i = yt −i
ut 其中: ut −i
yt −i t − i年修正后的数 yt −i t − i年实际数据 ut t年的市场占有率 ut −i t − i年的市场占有率
(6)移动平均和指数平滑法 如果原始数据总体走向具有一定规律性,但因受随机因素干扰, 数据离散度很大, 采用平均值法也难以处理。 这时可采用一次、 二次、 甚至三次移动平均和指数平滑对数据进行平滑,用平滑的数据建模。 在分解预测时,为处理季节数据,则必须采用高次幂的移动平均 法,对数据平滑。 (7)差分法
7
有些模型,例如鲍克斯-詹金斯模型只能处理平稳数据,如果原始 数据为非平稳数据,则需釆取差分处理。差分有三种主要类型:前向 差分、后向差分、中心差分。 前向差分:在处理时间数列时,一阶前向差分定义为
= x xt +1 − xt
' t
一阶前向差分是当时间由 t 变到 t+1 时, 二阶前向差分定义为
同理可以定义高阶后向差分 中心差分:在处理时间数列时,一阶中心差分定义为
= xt' xt + 1 − xt − 1
2
2
二阶中心差分定义为
xt'' = xt' + 1 − xt' − 1 = xt +1 − 2 xt + xt −1