当前位置:文档之家› 奥运会奖牌榜预测问题

奥运会奖牌榜预测问题

2016年中国矿业大学数学建模模拟竞赛参赛基本信息专用页承诺书我们仔细阅读了大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。

我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。

我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。

如有违反竞赛规则的行为,我们将受到严肃处理。

参赛学生基本信息日期:年月日里约奥运会奖牌榜预测摘要本文主要探讨了奥运会奖牌榜的预测问题,通过建立模型对2016年里约奥运会奖牌榜进行预测。

本文主要通过建立比较时间序列模型、多远线性模型喝灰色预测模型,使用MATLAB和SPSS软件对历届奥运会奖牌榜进行分析并最终得到最优预测模型。

在模型一的建立中,我们假设奥运会奖牌榜之语往届奥运会奖牌榜有关,使用时间序列法来进行预测,通过对数据拟合建立回归模型。

由于模型一得预测结果与实际奖牌榜出入较大,在模型二的建立中,我们综合考虑了国家GDP、人口数量、经济发展水平、人口结构和东道主效应等因素建立多元回归模型。

关键词:一、问题的重述奥运会是竞技体育顶级盛会,其所获奖牌数及国家排名在一定程度上是衡量一个国家体育水平的尺度,也是一个国家的经济、政治和综合实力的具体体现之一。

2016年8月6日早上7:00在巴西的里约热内卢隆重开幕(以下简称里约奥运会),对于正在举行的里约奥运会,大家普遍关心的问题就是奖牌榜的排名,奥运会奖牌榜成了大家关心的热点问题。

现请查阅资料,并根据以往各国奖牌榜排名情况,以及各国经济发展、人口体质、政府政策等各种能影响到奖牌榜的因素,建立数学模型,预测2016里约奥运会的奖牌榜前十名。

并据此对各国体育水平进行分类。

二、问题的分析三、模型假设俄罗斯队因为禁赛原因结果取预测值的2/3世界银行和奥委会提供的资料真实可靠今年奥运会共颁发302块金牌,960块奖牌四、符号说明i国家编号t奥运会届数M每个国家的金牌总数y每个国家奖牌总数POP国家的人口总数GDP国民生产总值Host奥运会主办国社会制度ysSGen青少年在总人口总所占比例五、建立模型及求解5.1、模型一得建立与求解5.1.1、模型一的建立:最简单的增长模型就是马尔萨斯的指数增长模型,设某年的奖牌数为(0)M ,n 年后的奖牌数为()M n ,届增长率为常数k ,则有:()(0)(1)n M n M k =∙+ (1)虽然该模型可以较好的预当参赛国家较少时的奥运奖牌榜,但在实际中增长率k 并不是常数且由于各种原因增长率差别较大,所以此模型无法有效的预测本届奥运会奖牌榜。

时间序列模型是描述时间序列统一性的一种常用方法,在预测未来事件时,通过该事件的历史数据揭示事假未来的发展规律,从而对该事件的未来做出预测。

时间序列模型强调时间因素在预测中的主体作用,暂不考虑外界因素的影响。

所以在模型的建立中我们假设奥运会奖牌榜只与历届奥运会成绩相关,暂不考虑其他因素的影响。

因为每一届奥运会比赛项目都在发生变化,奖牌总数也随之变化,为了使任意两届奥运会奖牌数目具有可比性,本文采取奖牌数目的相对值来进行计算,从而消除奖牌数目变化带来影响,即使用1,2,3ii ii M Ms M ==∑来计算。

在模型的建立当中,我们使用线性回归模型来预测2016年奥运会奖牌榜。

奥运奖牌总数和时间之间的一元线性回归模型为:01y t u αα=++(2)其中t 为时间,01αα、为待定参数,u 为随机变量,用MATLAB 拟合后得到总奖牌数目拟合曲线。

5.1.2、模型一的求解以德国为例进行2016年奥运会奖牌榜排名: 表一: 1992-2012年德国奥运会奖牌数年份 金牌数 金牌占比 奖牌总数 奖牌总数占比198848 19.92% 142 17.91% 199233 12.69% 82 10.06% 199620 7.94% 65 8.82% 200013 4.36% 56 6.07% 200414 4.64% 48 5.16% 200816 5.30% 41 4.28% 201211 3.64% 44 4.57% 由于1988年德国分为联邦德国和民主德国进行参赛,数据不具有参考价值,拟合时不予考虑。

德国历届奥运会奖牌总数拟合结果:图一:德国历届奖牌总数线性回归拟合曲线表二:奖牌总数线性回归结果:回归系数回归系数值估计0α0.3941α-0.0122R =0.877F =28.649ρ=0.006德国奖牌总数线性回归结果为:0.0120.394y t =-+使用SPSS 软件预测德国队在今年奥运会中拿到的总奖牌占比为0.0649。

使用同样方法对其他国家进行线性拟合结果如表三所示:、 表三:各国奖牌总数占比拟合结果:国家 拟合方程美国 0.0030.232y t =-+ 中国 0.1080.407y t =- 俄罗斯 0.0160.550y t =-+ 英国 0.0050.123y =- 澳大利亚 0.0020.032y t =-法国 (6)0.001310^y t -=+⨯日本0.0030.052y t =-德国 0.0120.394y t =-+ 意大利 0.0010.005y t =+韩国 0.0120.394y t =+ 荷兰 0.00070.00108y t =+ 匈牙利0.0030.019y t =-+通过对各个国家历届奖牌数目占比进行线性拟合,我们得到了每个国家金牌占比M 和总奖牌占比y 与奥运会举办届数t 的线性关系,并由此得到第26界奥运会的奖牌榜排名。

表四:第31届奥运会奖牌榜预测国家 奖牌总数 奖牌总数排名金牌数金牌数排名美国 99 1 42 1 中国 97 2 31 2 英国 50 3 12 4 澳大利亚 46 4 11 5 俄罗斯 42 5 18 3 法国 37 6 11 7 日本 37 7 7 11 德国 37 8 10 6 意大利 34 9 10 8 韩国251010 95.2、模型二的建立与求解 5.2.1、模型二的建立:由于在模型一中仅考虑时间因素,线性拟合结果不理想。

考虑到是否为东道主对比赛结果特别是金牌数量,具有显著影响,因此在模型二中,采用了灰色GM(1,1)模型与东道主因素相互结合的方法进行预测,假设奖牌榜上各成员成绩只与是否为东道主和在往届的表现有关。

客观世界中既有大量已知信息又有大量未知信息,相互交织。

如果将已知信息称为白色信息,未知或非确知信息称为黑色信息,既含有已知信息又含有未知或非确知信息的系统称为灰色系统。

这些系统仅具有以时间为序列的数据,因此在研究时可将时间序列转化为微分方程,建立抽象系统发展变化的动态模型,这就是灰色DM 或GM 模型。

在模型二中,为排除东道主所产生的显著影响,首先对原始数据进行了处理,将东道主当年奖牌与金牌占有量修正为上下两届的平均数。

同时考虑到各国的体育水平更多地由金牌(或奖牌)占有量体现,而不是由纯粹的数量决定,因此为了使任意两届奥运会奖牌数目具有可比性,本文采取奖牌数目的相对值来进行计算,从而消除奖牌数目变化带来影响,即使用1,2,3ii ii M Ms M ==∑来计算。

特别的,为简化运算假设本届将有金牌量为302个,奖牌量为960个,因此302i i M Ms = ,960i i y Ms = 。

GM(n ,h)模型是指n 序列h 阶线性动态模型,在模型二中我们采取单序列一阶线性动态模型,即GM(1,1)模型。

假设按照时间排列的处理后的金牌榜数据为{}(0)(0)()|1,2,3M M k k == ,利用累加生成法得到新数列(1)M ,其中:(1)(0)1()()ki M k M i ==∑ (3)生成的数列(1)()M k 为一阶一个参数的灰色微分方程,记为GM (1,1),即(1)(1)dM aM u dt+= (4) 其中a ,u 为待定常数,t 为时间变量。

该微分方程的解为:()(1)1(1)ak u u M k M e a a -⎡⎤+=-+⎢⎥⎣⎦ (5)该式的参数列为M=(a,u)t用最小二乘法求出1a ()T T N B B B H -= 由灰色GM(1,1)模型,有(1)(1)(1)(1)(1)(1)1(1)(2)21(2)(3)21(1)()2M M M M B M n M n ⎡⎤⎡⎤-+ 1⎣⎦⎢⎥⎢⎥⎢⎥⎡⎤-+ 1⎣⎦⎢⎥=⎢⎥ ⎢⎥⎢⎥⎡⎤--+ 1⎢⎥⎣⎦⎣⎦(0)(0)(0)(2),(3)()TN H M M M n ⎡⎤=⋅⋅⋅⎣⎦ 根据线性代数的相关知识可以求解、化简得到:112211(1)()()n n i i i i m n b b --===--∑∑ (6)111111(1)n n n i i i i i i i a n b h b h m---===⎤⎡=--÷⎥⎢⎣⎦∑∑∑ (7)111121111()()n n n n i i i i i i i i i u b h b b h m----====⎤⎡=-+÷⎥⎢⎣⎦∑∑∑∑ (8)由微分方程的解的表达式可求得()1Mk +因此第n 项的估测值为:(0)(1)(1)(1)(1)()Mk M k M k +=+- (9) 通过以上计算得到的拟合值、预测值,与给定数列存在一定误差,称为残差。

构造残差数列(0)(0)(0)()()()E k M k M k =- (10)残差数列可以揭示数据拟合值与实际值的差额,也可利用此序列再次应用GM(1,1)模型进行同样的计算,得到预测值的修正值。

将金牌榜奖牌榜数据代入,可得到预测的金牌榜奖牌榜数据及排名。

奖牌预测同理。

5.2.2、模型二的求解以韩国的金牌数预测为例,对模型二进行求解。

首先,对韩国历届获得金牌数量排除东道主因素的影响,并利用韩国每一届的金牌占比得到经过修正的金牌数,如下表所示: 1988 12 0.049792531 13.93846 1992 12 0.046153846 13.93846 1996 7 0.027777778 8.388889 2000 8 0.026845638 8.1073832004 9 0.029801325 9 2008 13 0.043046358 13 2012130.04304635813利用式(3)得到待处理数据:数列(0)()M k 、(1)()M k ,如下表所示 序号k12345 6 7 (0)()M k 13.93846 13.93846 8.388889 8.10738391313(1)()M k13.93846 27.87692 36.26581 44.37319 53.37319 66.37319 79.37319为求出a 、u ,由(1)(1)(1)(1)(1)(1)1(1)(2)21(2)(3)21(1)()2M M M M B M n M n ⎡⎤⎡⎤-+ 1⎣⎦⎢⎥⎢⎥⎢⎥⎡⎤-+ 1⎣⎦⎢⎥=⎢⎥ ⎢⎥⎢⎥⎡⎤--+ 1⎢⎥⎣⎦⎣⎦(0)(0)(0)(2),(3)()TN H M M M n ⎡⎤=⋅⋅⋅⎣⎦两个式子可计算出矩阵B 、H 中各元素,即h(i)与b(i)的值,具体数值如下表所示表七 灰色模型计算过程量1 2 3 4 5 6 Sum ()h i13.94 8.39 8.11 9.00 13.00 13.00 65.43 ()b i -20.91 -32.07 -40.32 -48.87 -59.87 -72.87 -274.92 2()b i437.13 1028.57 1625.66 2388.59 3584.80 5310.50 14375.26 ()()b i h i-291.42-269.04-326.89-439.86-778.35-947.35-3052.91由上表数据,以及式(6)、(7)、(8)可以求出a 、u 的值,由式(5)可知所构造的一阶微分方程的解为()(1)1(1)ak u u M k M e a a -⎡⎤+=-+⎢⎥⎣⎦将k 依次代入,得到韩国各届奥运金牌的预测值,并根据式(10)求出残差。

相关主题