模糊分析法解足球队排名问题
余科(数理学院122112 )
苏博飞(数理学院122111)
王有元(数理学院122111)
过思甸(公管学院023112)
摘要:本文解答了93年全国大学生数学建模竞赛B题,运用模糊聚类分析法,讨论了足球队比赛的排名问题。
首先,我们将数据进行预处理,求出每队的胜,负,平以及总场数,归一化处理后作为建模的影响因子,然后由相似系数构建模糊相似矩阵,最后构建模糊等价矩阵截取进行排名,并将得到的结果从12支队推广到了N支队的情况。
本文中所用的方法经过验证,得到的结果合理,可信。
关键词:模糊分析法,相似系数,比赛排名
一问题分析
根据题目所给的表格,我们能得到的数据是残缺和不整齐对称的,这样就给排名造成了困难。
例如在图表中,T1队和T2队打了三场比赛,和T5只打了一场比赛,和T11没打比赛。
这样如果只是单纯的利用胜利的场数来进行排名,所得到的结果必定是不完善的,同时也是不准确的。
因此为了得到较完善的结果,我们可以先将每个队所参加的比赛中,胜,负和平的场数列表如下,得到每个队实力的大概了解。
表一
场数
队T1 T2 T3 T4 T5 T6 T7 T8 T9 T10 T11 T12 胜10 5 8 1 2 2 13 6 7 6 1 2
负 5 4 4 12 5 3 1 8 8 5 6 3
平 4 6 3 6 2 0 3 3 2 6 2 4
总19 15 15 19 9 5 17 17 17 17 9 9
接着,我们分析各队在每场比赛中的平均进球数,失球数和进失球数差数,这些数据也有助于我们进一步了解各队的实力。
列表如下:
表二
T1 T2 T3 T4 T5 T6 T7 T8 T9 T10 T11 T12
进球数1.41
2
0.8 1.33
3
0.63
2
1 0.6 2.05
9
0.94
1
0.64
7
0.88
2
0.77
8
0.66
7
失球数0.94
1
0.66
7
0.8 1.68
4
1.44
4
1.2 0.58
8
0.82
4
1 1 1.55
6
1
进失球差0.47
1
0.43
3
0.53
3
-1.05
2
-0.44
4
-0.6 1.47
1
0.11
8
-0.35
3
-0.11
8
-0.77
8
-0.33
3
通过表一,二的分析,我们可以确定T7是最好的,T4是最差的,但是对于其他的球队仅以上述数据还是无法得出准确可信的排名。
为了得出合理可信的排名,我们还应该考虑,Ti与其余各队的比赛成绩,由于有的对和其余的对没有比赛,其成绩难以确定。
为了解决这个难题,我们准备先制定一个规则,为各队定义一组特征数据,同时计算各队之间的模糊相似度。
最后综合表一二,即可得出合理的排名出来。
二 模型假设
1,基本假设
1) 参赛各队存在客观的真实实力,这是任何一种排名算法的基础
2) 在每场比赛中体现出来的强队对弱队的表面实力对比是以它们的真实实力对比为
中心的互相独立的正态分布,这条假设保证了我们可以以比赛成绩为依据对球队的真实实力进行排名,
3) 每场比赛对于排名的重要性相同,每个进失球对于排名也同样重要。
4) 确定各队的特征数据时,仅计算进失球的差数。
2,建模假设
1)根据生活经验可以知道,甲以一场2:1胜乙,易于两场都以2:1胜乙,同理更易于
三场都以2:1胜乙。
对于这种情况,我们在进行计算时要对数据加权。
例如:r 甲乙=(2-1)
S ,r 甲乙=V *2/)]12()12[(-+-,r 甲乙=U *3/)]12()12()12[(-+-+-。
我们取U>V>S ,且令S=1.0,V=1.2,U=1.4。
2)Ti 与Ti 自身的特征数据为rii=0。
3)用绝对值减数法确定Ti 与Tj 之间的模糊程度:|-|-∑==jk k ik ij r r c x 12
11;通
过估算c=0.038;
4)排名原则:越先聚为一类的队,名次越靠近。
三 建模及求解
根据假设的模型,以及表一二的数据,可以计算出各队的特征数据如下,假设论域为T={T1,T2,T3,T4,T5,T6,T7,T8,T9,T10,T11,T12},于是有:
}
0,466.0,2,1,0,2,0,6.0,0,0,0,0,0{}466.0,0,1,1,2,2,0,0,0,0,0,0{}2,1,0,866.1,0,334.2,0,0,6.0,1,2,0{}1,1,866.1,0,0,334.2,0,0,6.0,1,2,3{}
0,2,0,0,0,4.1,0,0,6.0,1.0,6.0{}2,2,334.2,334.2,4.1,0,0,0,6.3,1,0,8.1{}
0,0,0,0,0,0,0,1,1,3,1,1{}6.0,0,0,0,0,0,1,0,1,1,0,2{}6.0,0,0,0,0,0,1,0,1,1,0,334.2{}0,0,1,1,1,1,3,1,934.0,0,466.0,466.0{}0,0,1,1,1,1,3,1,934.0,0,466.0,0,0{}0,0,0,3,6.0,8.1,1,2,334.2,466.0,0,0{121110987654321---=-----=--=----=-=-=---=----=----=--=---=---=r r r r r r r r r r r r 接着,利用绝对值减数法,可以计算I T 与Tj 的模糊相似程度ij x ,于是有模糊相似矩阵X :
1
828.01
623.0572.01
471.042.0478
.01699.0648.0681
.0529.01179.0129.0237.0303.0405.01
549.0488.0369.0521.0567.026.01
557.0577.0422.0574.062.0313.0749.01572.0602.0372.0569.0453.0004.0511.0645
.01516.0531.0296.0184.0493.0182.0506.0483
.0275.01678.0587.0392.0351.059.0389.0597.065
.0397.0641.01526.0511.0346.0306.0514.0339.0496.0473
.0351.0544.0666.01=
X 有前面的表一二分析得,4T 为倒数第一名。
再根据上面的模糊相似矩阵可以得出T1~T12中与T4的相似系数为:
表三
T1
T2
T3
T4
T5
T6
T7
T8
T9
T10
T11
T12
0.351 0.397 0.275 1 0.645 0.511 0.004 0.453 0.569 0.372 0.602 0.572
为了便于观察,我们将X4j(即j 队与4队的相似程度)用Tj 来表示,知道T5=0.645是除T4外最大的首先与4T 聚成一队的是5T ,因此可以得出5T 为倒数第二名。
同理,再由模糊相似矩阵得首先与5T 聚成一队的是6T ,则6T 为倒数第三名,依次类推则可得出排名如下表:
表四
根据模型的假设与模糊矩阵的计算,使得我们的排名具有一定的准确性和可信性。
四 模型的合理性分析及推广讨论
上述模型的优点在于:
1) 它存在反馈机制, 并且具有稳定性, 保证了排名的公平和令人信服。
2) 对要比较的两队之间没有必须比赛的要求,即使有部分数据残缺也不影响模型的建立及问题的求解。
3) 以上所作出的排名算法很容易得到推广,当队数不是12而是N 时,可以利用计算机来
进行计算。
此外,我们的算法还受到一些条件的约束:
1)当有二个队的比赛成绩完全一样时,该算法不能排出名次来;
名次 1 2 3 4 5 6 7 8 9 10 11 12 队名 T7
T3
T1
T9
T10
T8
T11 T12
T2
T6
T5
T4
2)当根据比赛成绩无法判断哪些队成绩较好或较差时,算法无法排出名次;3)当数据残缺太多时,无法排出名次。
参考文献
【1】邬学军,数学建模竞赛入门与提高,浙江大学出版社,2012.1
【2】姜启源,谢金星,数学模型案例选集,高等教育出版社2006-7-1。