当前位置:文档之家› 洪峰流量预测

洪峰流量预测

2013年河南科技大学数学建模选拔赛承诺书我们仔细阅读了数学建模选拔赛的规则.我们完全明白,在做题期间不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人研究、讨论与选拔题有关的问题。

我们知道,抄袭别人的成果是违反选拔规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。

我们郑重承诺,严格遵守选拔规则,以保证选拔的公正、公平性。

如有违反选拔规则的行为,我们将受到严肃处理。

我们选择的题号是(从A/B/C中选择一项填写): A 队员签名:日期:2013年8月23日2013年河南科技大学数学建模竞赛选拔编号专用页评阅编号(评阅前进行编号):洪峰流量预测摘要本文讨论了关于百年一遇的定义、百年中最大洪峰流量预测、怎样根据现有的年最大洪峰样本来预测未来三年的洪峰值等问题。

首先对于问题一,通过查阅资料并客观的分析,可认为“百年一遇”不能简单机械的理解为“一百年只出现一次”。

百年一遇应该理解为数学统计中的“概率”,指的是随机事件发生的概率,表现在时间上就是我们平常所说的“时间周期”。

百年一遇,就是指超过一定标准的洪峰流量超过一定标准发生的概率是1%。

对于问题二,考虑到洪峰流量的分布,在较大值和较小值分布较少,处于一般情况下的分布最多,因此,考虑正态分布建立模型。

我们通过spss进行正态分布拟合的探索。

然后我们对拟合的正态分布的正态性进行检验,结果发现正态性良好,我们建立的正态分布模型成立。

然后我们求得此正态分布概率密度函数,然后对正态分布概率积分函数进行求解,得到概率积分为0.99的临界点0781.14x=,作为“百年一遇”的观测值,即超过此值,我们就称为“百年一遇”。

此观测点0781.14x=为百年一遇的洪峰流量值。

对于问题三,题中要求对后三年的洪峰量进行预测,再分析了题目后我们选择了用灰色理论对数据进行预测,建立灰色模型求解预测结果三年内结果均无明显变化,对模型检验发现模型并不合理,后来我们又对模型进行了改进,用马尔科夫与灰色理论混合关键字:正态分布马尔科夫预测灰色预测问题重述外界对三峡工程“万年一遇”“千年一遇”“百年一遇”等防洪标准说法不一提出质疑,并将相关报道整理如下:现假设附件中是某水文站的每年的最大洪峰流量观测值。

1、有人说,百年一遇就是一百年内只出现过一次,能否这样理解?给出你对“百年一遇”的定义。

2、能否计算出附件中水文站百年一遇的洪峰流量值;如能,给出具体的计算过程及结果。

3、预测该水文站将来3年内每一年的最大洪峰流量。

问题分析对于问题一,如何定义“百年一遇”,首先否定了“百年一遇就是一百年内只出现过一次”的理解。

经过查相关资料所得:所谓“百年一遇”这是一个关于频率的概念。

它表示在许多次试验中某一事件重复出现的时间间隔的平均数。

需要特别指出的是所谓“重现期”并不是说正好多少年中出现一次,它带有统计平均的意义,说得更确切一点是表示某种水文变量大于或等于某一指定值,每出现一次平均所需的时间间隔数。

对此,可以通过随机模拟来对此进行解释,通过MATLAB 随机产生一百个随机数来代表这一百年的洪峰,用其中的最大洪峰值来代表百年一遇的最大洪峰值,再用随机抽样的方法确定最大洪峰值发生的概率。

从而可以确定上述说法的错误在于把平均发生的次数认为了为一定会发生。

准确定义应用概率来定义为:在一百年中每天最大洪峰发生的概率为1%。

对于问题二求最大洪峰值,可以根据现有的某水文站的数据,将其分成间距相同的组,计算出各个组中的频数,通过计算出这些样本的平均值和方差来估计整体的均值和方差,从而确定洪峰值分布的概率分布曲线。

通过确定洪峰值大于等于百年洪峰值得概率为1%所对应于的洪峰值作为百年一遇的最大洪峰值。

对于问题三,可以采用灰色理论预测模型,预测该水文站将来3年内每一年的最大洪峰流量。

基本假设1、所给数据真实有效,水文站的检测结果可靠无差。

2、每年最大洪峰流量只考虑时间的影响,附表没给出影响因素,不加考虑。

3、不考虑环境剧烈变化所引起的对预测结果的影响。

符号说明()i i i X i F x X X μσ 第个洪峰流量值洪峰流量的概率密度函数的均值的标准差12g g 偏度峰度12g g σσ 偏度的标准误峰度的标准误x t tμσ-=α∧ 带估参数x 概率积分为0.99的观测点()0iX 第i年份的最大洪峰值()1iX 第i个叠加序列的值模型的建立与求解对于问题一:经查阅相关资料可以得到关于百年一遇的理解: 所谓“百年一遇”这是一个关于频率的概念。

往往用“重现期”来替代“频率”,它表示在许多次试验中某一事件重复出现的时间间隔的平均数。

需要特别指出的是所谓“重现期”并不是说正好多少年中出现一次,它带有统计平均的意义,说得更确切一点是表示某种水文变量大于或等于某一指定值,每出现一次平均所需的时间间隔数。

经分析可以用随机模拟的方法来解释,先用MATLAB随机产生一百个数如附录:用随机抽样的方法对数据进行单次抽样,进行一百次,分别代表一百年,每个数分别代表每一年的洪峰值,最大的数可以作为百年一遇的最大洪峰值。

用excel进行一百次的随机抽样并统计不同阶段的的概率得:并得出其直方图:可以得出最大流量值得概率为:P=0.01。

则发生次数均值为()1E X =,百年中发生次数为1仅仅是在大量实测统计的情况下,百年发生的均值。

但是在实际中每一年都有0.01的概率发生。

所以不能说是一百年中一定会发生。

我们期望找到一个的洪峰流量值,作为一个观测点,即衡量的标准,超过此洪峰流量,我们就称之为“百年一遇”。

此观测点,应能保证有99%每年最大洪峰流量都小于此观测点,即大于此观测点的每年最大洪峰流量出现的概率为1%,引入重现期,即重现期为100年。

对于问题二:考虑到每年的洪峰流量的值,分布的范围在,很大或很小的情况很少,而大多数都分布在洪峰流量既不很大,也不很小的范围内,由此我们联系到所学的正态分布,可以考虑建立起一个关于洪峰流量的正态分布的模型。

1、模型的建立建立以下正态分布的模型:()22(x )2F x μσ--=通过spss 中分析→探索描述性统计,可得到正态分布的μ,σ。

以下是spss 处理的结果:可得到=537.43μ,=104.597σ。

正态性检验:经查询资料,得知,正态分布的正态性的两个评判标准为偏度1g 和峰度2g ,以及Q-Q 图。

(1)、偏度,峰度检验方法通过计算1g 和2g 及其标准误1g σ及2g σ然后作U 检验。

两种检验同时得出0.05 1.96U U <=,即在95%的置信概率下,可以认为正态性良好。

11gg U σ=22gg U σ=下面给出spss 做出的偏度、峰度检验的结果 :可得10.733g = 10.441g σ=;2 1.122g = 20.858g σ= 计算得:偏度检验:110.7331.6621 1.960.441gg U σ===< 峰度检验:221.1221.3077 1.960.858gg U σ===< 由检验结果可知,在95%的置信概率下,偏度、峰度检验均合格,即在偏度、峰度检验下,正态分布的正态性良好。

(2)、 Q-Q 图检验以样本的分位数作为横坐标,以按照正态分布计算的相应分位点作为纵坐标,把样本表现为指教坐标系的散点。

如果资料服从正态分布,则样本点应该呈一条围绕第一象限对角线的直线。

我们根据spss 作出Q-Q 图如下:由图可知,28个观测点中,由27个都是很好的围绕(几乎完全分布)在第一象限对角线上,只有第28个观测点,偏离稍远。

因此,我们完全可以认为Q-Q 图检验的结果为,其探索的正态分布的正态性良好。

(4)、正态分布模型()2(x )2F x μσ--==537.43μ=104.597σ即:()20,N x μσ我们此时是由样本来估计总体,由样本求出的=537.43μ,=104.597σ,均是对总体μ,σ的无偏估计。

故我们建立的这一正态分布模型可以推广到总体更一般的情形。

则,总体最大洪峰流量的概率密度函数为:()22(x 535.43)2(104.597)F x --⨯=下面是我们用matlab 做出的总体正态分布曲线图3、对“百年一遇”的最大洪峰流量值得计算 (1)、()P x 概率积分函数 ()t Φ= 概率积分函数()()P x F x dx =⎰引入新的变量t ,x t μσ-=对于一般的正态分布()2,N μσ,()F x 的值可以利用以下变换公式计算:()222()22x t t xu u x F x e dt e du μμμσσσμσ---=---∞-⎛⎫−−−==Φ←−−− ⎪⎝⎭⎰⎰ 注:此变换公式为摘录,其中变量与我们建立模型所用变量含义可能不同,仅供参考。

故我们做类似变换得到:()()P x t =Φ不同的()t Φ值,可由正态分布积分表查出。

由我们在第一问给出的定义,“百年一遇”即大于此洪峰流量的概率小于1%,即“百年一遇”的临界值0x ,小于此洪峰流量值的概率积分为99%()99%P x = ()99%t Φ=查表得出 2.33t =,得出了“百年一遇”的最大洪峰流量值临界点0x0x t σμ=+代入数据:104.975σ= 537.43μ= 得:0 2.33104.597537.43781.14x =⨯+=由此,我们得出了总体的“百年一遇”的洪峰流量值的临界点0781.14x =,即当某年的最大洪峰流量大于此临界点,我们就称为百年一遇。

对于问题三(1)模型建立通过对问题的分析,得出对洪峰值的预测可以建立灰色理论预测模型。

建立某水文站从1985到2012年最大洪峰值的原始时间序列为:{}{}(0)(0)(0)(0)(0)638(1),(.102),(3)658.99485.52672,...,(283)2=.X X X X X = ,,,,将原始数据按如下方式累加:()()()()()()()()()()()()()()()()()()()()()()()()()()()()()()10100102710101281010111=21212=1297.09272627=14375.672827+28=15047.9638.10i i X X X X X X X X X i X X XX i X X ====+=+==+==∑∑得到新的序列:()()()()()()()(){}{}11111638.101297.091,2,3,...14375.67,15047.,28=9X X X X X = ,,,令()1Z 为()1X 的紧邻均值生成序列:()()()()()()()111112Z k X k X k =-+()()()()()()(){}{}1111=23,,28967.595,1585.645,,14711.785Z Z Z Z = ,则GM(1,1)的灰微分方程为:()()()()10X k Z k αμ+=其中:α称为发展系数;μ称为内生控制灰数。

相关主题