水质评价问题的数学模型摘要本文以某村四个水井因农业和生活排放废物使地下浅表水遇到污染为背景,通过对这四个水井的24个水质监测数据的统计,对四个水井的综合水质进行了细致的分析。
针对问题一:首先从水质监测数据中选取相对有用的五种关键数据(分别为溶解氧,高锰酸盐指数,总磷,氨氮,粪大肠菌群)作为评价因子,对各个水井的各种污染物的检测数据进行无量纲标准化处理得到新数据并列出图表,并对比水质分级标准的三组数据,运用层次分析法建模,并利用MATLAB7.0.1编程求解,最后求得北井的水质最好,南井和东井水质次之,西井水质最差。
此外,我们还运用了逼近于理想值的排序方法,即TOPSIS法,首先确定四个水井水质监测数据中各项指标的正理想值和负理想值,然后求出各个方案与正理想值、负理想值之间的加权欧氏距离,由此得出各评价因子与最优数据指标的接近程度,作为评价水井水质优劣的标准。
经计算得出四个水井的综合评价指标值分别为90,73,210,505,可见北井水质最好,南井水质较好,东井水质中等,西井水质最差。
针对问题二:对四个井的地表水进行水质等级判断时,没有明确的界限,因此我们选择在模糊数学中采用隶属函数来描述水质分界,同时采用格贴近度公式,分别求得四个水井与三个水质等级的贴近程度,根椐择近原则,算出西井、东井均属于Ⅲ类,南井属于Ⅱ类,北井属于Ⅰ类。
最后,我们就模型存在的不足之处提出了改进方案,并对优缺点进行了分析。
关键词:层次分析法;TOPSIS法;模糊数学统计算法;水质等级判断。
目录摘要 (1)一、问题重述 (3)二、模型假设 (3)三、符号说明 (3)四、问题分析 (4)4.1问题一的分析 (4)4.1.1层次分析法 (4)4.1.2 TOPSIS分析法 (5)4.1.3 两种方法差异分析 (5)4.2 问题二的分析 (5)五、模型的建立和求解 (5)5.1 问题一求解 (5)5.1.1各衡量指标数据的无量纲化处理 (5)5.1.2. 模型一层次分析法 (8)5.1.3 模型二 TOPSIS分析方法 (11)5.1.4 两种方法的结果分析 (14)5.2 问题二:模糊性模型 (14)5.2.1 建立因素集 (14)5.2.2 设置偏大型柯西分布隶属函数 (15)5.2.3 综合指标 (17)六、模型的评价与推广 (18)6.1 模型的评价 (18)6.1.1模型优点 (18)6.1.2模型缺点 (18)6.2 模型的推广 (19)参考文献 (20)附录 (21)一、问题重述某村内有各相距500米以上的四口水井,分别位于村东、村西、村南和村北,由于农业和生活排放废物使地下浅表水遇到污染,水质监测资料如附件1所示.需要解决的问题如下:(1)请用2种以上的数学方法对该村的四个井水的水质进行排序,并比较是否由于方法的不同导致存在着异,以及差异产生的原因。
(2)请对该村的四个井的地表水分别进行水质等级判断。
(水质分级标准参考附件2,或自己查有关资料)二、模型假设(1)不考虑元素间的相互作用的影响(2)短期内重金属元素的物理、化学变化及迁移对周围环境影响不大(3)假设附录中所给该村井水水质监测的数据真实,不会有大的偏差。
(4)不考虑历史沉积的重金属的影响三、符号说明四、问题分析4.1问题一的分析要对东井、西井、南井、北井四个水井的水质进行排序,并比较是否由于方法的不同导致存在差异,以及差异产生的原因,可从题目的要求中获知利用附录1中的水质监测数据来进行四个水井的排名。
经过分析和查阅相关资料,可以运用层次分析法和TOPSIS 分析方法求解。
在该问题中,我们选择从溶解氧、高锰酸盐指数。
总磷、氨氮、粪大肠菌群这几个方面(PH 值为无量纲量在此不讨论,之所以选取这五个指标,是由于附件二中,关于水质分级标准,除这五个指标外的其他指标项目在分级时至少有两个标准值是相同的,对于水质的衡量没有太多帮助)来衡量四个水井的水质情况,从而建立了层次结构模型和TOPSIS 分析模型。
4.1.1层次分析法(1) 最大特征值max λ的MATLAB 计算方法:[]()eig A =V,D ,其中A 为待计算特征值的矩阵,D 为对角矩阵,其对角元素为A 的特征值,最大的即为max λ 。
(2)一致性指标CI 计算方法:max 1n CI n λ-=-(其中λ为矩阵A 的最大特征值,n 为矩阵的阶数)(3)随即一致性指标RI 的计算方法:RI 与n 有如下关系,如表计算矩阵A的特征根及特征向量,将所求的特征向量单位化后得到的就是权重值。
4.1.2 TOPSIS分析法此外,该问题还可以应用TOPSIS方法是一种逼近理想解的排序法。
其基本思想是把综合评价问题转化为求各种评价对象之间的差异——“距离”,即按照一定的法则先确定理想解与负理想解,然后通过计算每一个被评价对象与理想解和被理想解之间的距离,再加以比较得出其排序。
4.1.3 两种方法差异分析由于方法的不同,对数据的使用及舍入也有所不同,加之分析问题的角度不同,所以结果可能出现差异,不过可以确定,尽管计算方法存在不同,如果两种方法都计算准确的话,结果不会有太大出入。
4.2 问题二的分析通过仔细分析题目的要求,得知题目要求我们找出对该村的四个井的地表水分别进行水质等级判断。
于是我首先想到了利用模糊数学模型中的一个偏大型柯西分布隶属函数去处理,据模糊识别原则中的择近原则,同时运用格贴近度公式,求解出四个与I类、Ⅱ类、Ⅲ类哪个水质等级标准更符合。
五、模型的建立和求解5.1 问题一求解先对各评价因子进行无量纲化处理,再分别应用层次分析法和TOPSIS分析法建立模型求解。
5.1.1各评价因子数据的无量纲化处理在利用SPSS统计软件数据进行聚类分析的时候,因为单位不统一需要进行无量纲化处理,我们采用均值化方法,即每一个变量除以该变量的平均值,即xx x ii =', (1) 标准化以后各变量的平均值都为1,标准差为原始变量的变异系数。
该方法在消除量纲和数量级影响的同时,保留了各变量取值差异程度上的信息,差异程度越大的变量对综合分析的影响也越大。
对极大型指标溶解氧的指标做极小变换,即取倒数变换,其中*111234i a i a ==、、、。
用EXCEL 方法作出标准化前后的各变量数据如表1所示:表中所示分别为四个水井的五项评价因子的源数据和无量纲化后数据,以及水质分级标准的源数据和无量纲化后数据。
五种评价因子数据表示如下:5.1.2. 模型一层次分析法(1)建立层次结构模型水质的分级是由一个相互关联、相互制约的众多因素构成的复杂而往往缺少定量数据的系统。
层次分析法为这个问题的决策提供了一种新的、简洁而实用的建模方法。
(2)构造判断矩阵层次结构反映因素之间的关系,但准则层中的各准则在目标衡量中所占的比重并不一定相同,在决策者的心中,它们各有一定的比例。
设现在要比较的5个因子{}12345,,,X x x x x x =,对水质Z 的影响大小,我们采取对因子进行两两比较建立成对比较矩阵的办法,即每次取两个因子i x 和j x ,以ij a 表示i x 和j x 对水质Z 的影响大小之比,全部比较结果用矩阵()ij n n A a ⨯=表示,称A 为A Z -之间的成对比判断矩阵,容易看出,若i x 与j x 对Z 的影响为ij a ,则j x 与i x 对Z 的影响为1ji ija a =。
设12345,,,,C C C C C 分别表示溶解氧,高锰酸盐指数,总磷,氨氮,粪大肠菌群,则准则层的判断矩阵()ij n n A a ⨯=为⎛⎫ ⎪1 3 2 2 4 ⎪111 ⎪ 1 1 ⎪322 ⎪1 ⎪ 2 1 3 12 ⎪ ⎪111 1 1 ⎪234 ⎪ ⎪1 2 1 4 1 ⎪⎝4⎭根据题中所给数据得到决策层的判断矩阵如下,其中123,,P P P 4,P 分别表示东井,西井,(3)层次单排序及一致性检验对应于问题一,则是用MATLAB 工具计算出矩阵()ij n n A a ⨯=对应于最大特征值max λ的特征向量W ,归一化处理后即为措施层中三个等级对于准则层中五个污染物指标相对重要性的排序权值。
同时,可以由max λ是否等于矩阵A 的阶数n 来检验矩阵A 是否为一致矩阵。
由于特征根连续的依赖于ij a ,故max λ比n 大得越多,A 的非一致性程度也就越严重,max λ对应的标准化特征向量也就越不能真实地反映出{}12345,,,X x x x x x =,在对因素Z 的影响中所占的比重。
对所得到的判断矩阵做一次一致性检验,以便决定是否能接受它。
判断矩阵的一致性检验步骤如下: (1)计算一致性指标CImax1nCI n λ-=-,其中n 为判断矩阵A 的阶数5 通过MATLAB 编程(见附录1)得到判断矩阵A 的max λ为5.6579,CI 为0.1645。
(2)查找相应的平均随机一致性指标RI 。
对于1,,9n =,RI 的值如表2所示:(3)计算一致性比例CRCI CR RI= 当0.10CR <时,认为判断矩阵A 的一致性是可以接受的。
由上两个步骤算出CR 为0.0762,则该判断矩阵的一致性是可以接受的。
(4)层次总排序及一致性检验由上面得到的措施层各等级对准则层中各个衡量指标的权重向量0w =(0.3955,0.0996,0.2048,0.0960,0.2042),最终要得到最底层中各方案对于目标的排序权重,从而进行排序。
总排序权重要自上而下地将单准则下的权重进行合成。
准则层(C 层)包含12345,,,,C C C C C 共5个元素,他们的层次总排序权重分别为12345,,,,c c c c c ,方案层包含3个因素123,,P P P 4P , ,它们关于上一层次单排序权重分别为()15,,w w 0.1884 0.1026 0.2819 0.4258 0.1948⎛ 0.4623 0.1274 0.3677 0.3737 0.4336= 0.2049 0.3850 0.2000 0.1373 0.1768 0.1444 0.3850 0.1504 0.0631 0.1948 ⎝⎫⎪⎪ ⎪ ⎪⎭,关于总目标的权重123,,W W W 4,W 按照51,1,,4i ij j j W w a i ===∑来计算。
最后得到各水井的综合评价为()0.2139,0.3838,0.1750,0.1313B =根据模型的特点,可知,最后综合评价值越小,对应水井的水质越好,则可以看出,北京的水质最好,东井和南井水质次之,西井水质最差。
5.1.3 模型二 TOPSIS 分析方法TOPSIS 方法是一种逼近理想解的排序法。
其基本思想是把综合评价问题转化为求各种评价对象之间的差异——“距离”,即按照一定的法则先确定理想解与负理想解,然后通过计算每一个被评价对象与理想解和被理想解之间的距离,再加以比较得出其排序。