数学建模竞赛成绩的评定摘要本文主要采用统计学方法,结合EXCEL MATLAB、等数学统计工具解决了数学建模中成绩的评定等一系列问题。
关于问题一,如何补缺缺失数据,我们将各个老师对数学建模队的评分视为随机事件,算出各分数发生的概率,最后用其数学期望代替缺失的分数,得出结果为:9号队缺失的分数是77;25号队缺失的分数是80;58号队缺失的分数是80。
关于问题二,考虑到各个老师的打分方式有异,根据加权平均分给出了101个队列的排名,结果详见表5.2.1。
关于问题三,利用统计学方法,通过比较每位老师评分的方差大小,得出各老师打分严格程度的差异,最后得出老师甲最严格,老师丙最宽松,其余三位老师的严格程度相差不大。
关于问题四,先将参加队的平均分数从大到小排序,然后其中有48个队参加复评。
关键词:成绩评定成绩排名数学期望统计学MATLAB加权平均一、问题重述在某高校一次数学建模竞赛中,5位评阅老师分别独立地为101个参赛队打分,最终依据某种方式对各参赛队进行排序、确定所获的奖项。
(见附表),请你运用数学建模方法解决下列问题:(1)补齐表中缺失的数据。
(2)给出101个参赛队的排名顺序。
(3)建立模型对5位老师进行分类,评价5位老师中哪位老师打分比较严格,哪位老师打分比较宽松(4)通常还会对一部分平均分在80分以上的参赛队进行复评,你认为应该对哪些队进行复评二、问题分析此问题是关于五位老师对101个参加队进行评分的问题。
根据问题要求首先我们采用数学的方法对该题进行分析,补全附表中缺失的三个分数。
再根据已补全的数据排列出参赛队的排名。
然后确定哪位老师打分比较严格,哪位打分比较松,并给出可以给予复评机会的参赛队的序号。
三、问题假设1、假设所有老师的评分都是客观、公平公正的。
2、假设所提供的数据都是真实可靠的。
3、假设参赛队是否有复评机会对其所打的分有关和其他因素无关。
四、变量说明五、模型的建立与求解问题一 5.1.1 问题分析该问题要求我们根据已有的数据,利用数学知识分析并补全缺失的数据。
显然均值替换法,热卡填充法等都可以解决问题,但是综合分析一下,该问题属于统计类问题,所以我们最终选择应用统计学的方法,给出的评分最合理的替代应为这个老师给所有参赛队打分的数学期望。
5.1.2 模型的建立根据数学统计的方法,我们将一位老师的评分视为自变量x ,其发生的概率为()p x 。
由于样本空间够大,所以其发生的频率可近似视为其发生的概率。
即:()(),1,2,,101;101i x i i n p x f x i N N≈===而其数学期望为所有自变量的取值与其发生概率的乘积的和,即:(),1,2,,101i i EX x p x i ==∑由此算出的数学期望的值即为此老师所缺评的分数的替代。
5.1.3 模型的求解按上述方法,代入数据后得出老师甲的评分分布表(表5.1.1)与其散点图(图):020406080100120图5.1.1老师甲对参赛队的评分分布图再将表5.1.1中数据代入期望公式即可求出甲老师对101个参赛队打分的数学期望:1EX =≈77,同样的方法我们可依次求出第二位老师对参赛队打分的数学期望:2EX =≈80,第三位老师对参赛队打分的数学期望:3EX =≈80,由此我们即可确定9号参赛队缺失的分数是77,25号参赛队缺失的分数是80,58号参赛队缺失的分数是80。
问题二 5.2.1 问题分析该问题要求我们根据已补全的数据对参赛队按分数的高低进行排序。
可以将五位老师对各个参赛队的评分相加得总分,然后求其平均分再根据所得平均分的高低进行排序;也可以考虑到有些老师可能因为主观原因对参赛队打得分偏高或者偏低,因此可以选用对每个参赛队采取去除最高分和最低分之后再对其求平均分的方法,这样相对直接求平均分更具有公平性。
但是考虑每位老师的评分标准、方式不同,所以我们选择先根据所有数据算出五个老师各个评分的权重,然后将参赛队的分数加权平均后排序,即得录取顺序。
5.2.2 模型建立首先根据算出五个老师所打分的平均值向量012345[,,,,]w b b b b b =,其计算公式为:,1,2,,5;1,2,,101;101ijij xb j i N N====∑归一化后得五个老师打分的权重向量112345[,,,,]w c c c c c =,其计算公式为:,1,2,,5jj jb c j b==∑参赛队i x 的加权平均分为:1,5mijjj i x cx m m===∑而后根据由此得到的分数排序。
5.2.3 模型求解(1)在EXCEL中根据各位老师对每个参赛队的打分计算出每位老师评分的平均值向量0w0[76.55446,79.86139,80.08911,79.26733,79,9802]w=(2)据此用MATLAB软件计算每个老师对参赛队评分的权重向量为[0.1934,0.2018,0.2024,0.2003,0.2021]r=(3)将上述数据代入公式后得参赛队的排名为下表(表5.2.1):问题三 5.3.1 问题分析该问题要求我们对五位老师给各个参赛队的所有评分进行分析比较,给出哪位老师的打分比较严格,哪位老师打分比较宽松。
易知,对于不同的参赛队,打分严格的老师对优劣比较分明,于是打出的分数也会波动比较大;反之,打分宽松的老师则给予参赛队的分数波动较小。
而波动程度大小的比较可以通过分别统计高、低分段的人数来观察出,高、低分段人数都多的则打分严格,只有高分段或低分段人数多或者高、低分段人数都较少的则打分宽松。
但考虑到这样做的误差可能比较大。
所以又采取计算其样本方差,通过其值比较大小来验证上面所得结论(方差越大,波动程度越大)。
5.3.2 模型的建立(1)由于所有的评分都处于[50,100]之内,所以,我们可以取[50,60]为低分段,[90,100]为高分段。
(2)设X 是一个随机变量,若2[()]E X EX -存在,则称2[()]E X EX -为X 的方差,记为()DX Var X 或。
即2[()]DX E X EX =-称为方差,即用来衡量一组数据的离散程度的统计量。
方差刻画了随机变量的取值对于其数学期望的离散程度。
(方差越大,离散程度越大;反之则越小) 若X 的取值比较集中,则方差DX 较小;若X 的取值比较分散,则方差DX 较大。
因此,DX 是刻画X 取值分散程度的一个量,它是衡量X 取值分散程度的一个尺度。
换而言之,方差就是和中心偏离的程度。
用来衡量一批数据的波动大小(即这批数据偏离平均数的大小)并把它叫做这组数据的方差,记作DX 。
在样本容量相同的情况下,方差越大,说明数据的波动越大,越不稳定。
方差的值的计算公式:101;5,...,2,1;101,...,1,)(12j ===-=∑N j i x xNDX ij ij其中:,101ijij xx N N==∑5.3.3 模型求解20406080100120图5.3.1老师甲对参赛队的评分分布图图5.3.2老师乙对参赛队的评分分布图020406080100120图5.3.5老师戊对参赛队的评分分布图):由表5.3.1得出打分最严格的是老师甲,最宽松的是老师丙,老师乙、老师丁、老师戊打分方式相对老师甲、老师丙而言较为居中。
但是在理论上这样的结论说服力不够,所以再将数据代入方差的值的计算方程,得出结果如下表(表):最小,而老师乙、老师丁和老师戊给出的评分的方差则居前两者之间。
所以得出结论如下:老师甲打分比较严格,老师丙打分比较宽松。
问题四 5.4.1 问题分析该问题要求根据已知的数据和前几问的结果,确定哪些参赛队应该给予复评的机会。
显然这是关于数学建模竞赛时选取哪些参赛队参加复试的问题,根据平均分的排名,起初,我们确定出了49个参赛队得到复评机会。
但是考虑到参赛队的能力不同,需要着优考虑。
所以我们再49个参赛队(详见附录3)加入了方差排名。
5.4.2 模型建立(1)将问题二求得的各老师打分的权重向量:[0.1934,0.2018,0.2024,0.2003,0.2021]r =代入公式,1,2,,101;1,2,,5;5ij jji x rx i j M M====∑可以求得49个参赛队的分数加权平均后的分数。
(2)根据公式21(),5i ij i jDX x x M M =-=∑ 可以求得五位老师给49个参赛队的评分的方差。
5.4.3 模型求解(1)49个参赛队平均分的排名在附录3中已经给出。
(2)将所有数据代入方差求值公式后得出各个参赛队对应方差值的排序为下表(表5.4.1):(3)附录三和表5.4.1两排序的前49名,如下表(表):(4队的序号,总有46个参赛队得到复评机会,见下表(表5.4.3):六、模型的优缺点优点:(1)在问题一中,摒弃了传统的平均值代替法,采用数学期望代替,提高了模型的可靠性,使结果更有说服力。
(2)在问题二中,较一般的采用总分排名多考虑了各个老师评分方式不同,采用加权平均,减少了由于主观人为因素对录取结果的影响。
(3)在问题三中,对于老师打分的严格和宽松,通过计算出老师打分的方差,进行比较,这样提高了模型的可靠性,更有说服力。
缺点:(1)在问题三中,由于打分严格程度的概念定义不明确,所以构建的模型可能会与本来意图有所差异。
(2)在问题四中,我们采取的是平均分排名,这样就增加了不公平的因素,如果改善成加权平均分排名,也许会更好一点。
七、参考文献[1]姜启源,谢金星,叶俊。
数学模型。
北京:高等教育出版社,2003。
[2]Frank ,Maurice ,William (著),叶其孝,姜启源(译)。
数学建模。
北京:机械工业出版社,2005。
[3]司守奎,孙玺菁。
数学建模算法与应用。
北京:国防工业出版社,2011。
[4]周品,赵新芬。
数学建模与仿真。
北京:国防工业出版社,2009。
[5]徐建华。
现代地理学中的数学方法。
北京:高等教育出版社,2004。
%按照此程序分别计算出老师甲所打分中各个分数的频数A=[68 92 88 81 83 84 76 53 66 85 78 58 94 94 93 63 91 94 56 6186 69 92 68 71 61 63 86 64 60 82 88 60 59 65 84 65 92 84 9490 67 63 85 86 88 62 80 87 94 55 90 59 98 93 75 63 71 55 8651 81 90 60 74 63 58 68 70 86 97 78 63 67 91 63 87 65 78 8190 64 78 61 90 93 69 88 76 82 60 75 79 74 70 93 85 81 86 92]';B=A(:);X=1:100;plot(B,X,'*')gridA1=unique(A)A1 =Columns 1 through 1951 53 55 56 58 59 60 61 62 63 64 65 66 67 68 69 70 71 74Columns 20 through 3875 76 78 79 80 81 82 83 84 85 86 87 88 90 91 92 93 94 97Column 3998m=0;for k=1:100if A(k)==51m=m+1;endendm%计算老师甲的评分的数学期望t=[1 1 2 1 2 2 4 3 1 7 2 3 1 2 3 2 2 2 2 2 2 4 1 1 4 2 1 3 3 6 2 4 5 2 44 5 1 1];s=t/sum(t);A1=unique(A);E=A1.*s’E =%计算参赛队的分数加权平均后的排名w=[,,,,];%在EXCLE中根据各位老师对每个参赛队的打分计算出每位老师评分的0平均值向量wr=[ ];%每个老师对参赛队评分的权重向量为A=[68 73 85 88 8692 69 74 65 8388 76 76 70 8081 73 84 98 9483 79 95 83 9884 67 86 56 6676 76 68 64 8653 96 65 95 9477 97 76 87 6466 93 80 90 7385 95 81 81 6978 66 99 90 7158 86 72 63 8194 84 70 78 8694 81 80 66 9293 66 91 74 9763 74 90 63 9291 79 83 85 8494 95 64 96 9556 67 91 97 5661 80 79 70 6986 96 79 84 7569 90 65 65 7692 85 82 66 6868 80 65 84 8771 66 61 75 9461 74 76 87 7863 80 69 76 8486 68 95 71 8464 83 61 90 9660 85 96 67 8782 84 97 78 6088 92 66 59 9560 91 78 78 8159 97 75 76 8865 87 86 64 9684 78 83 61 8592 99 79 86 90 84 82 92 95 76 94 90 65 66 84 90 79 85 81 58 67 89 84 75 93 63 82 65 69 6685 97 83 84 7086 76 64 87 69 88 88 96 80 87 62 98 74 93 62 80 93 85 82 72 87 84 80 93 64 94 85 94 74 93 55 75 93 84 60 90 68 88 92 83 59 95 69 75 74 98 63 80 63 84 93 55 66 84 96 75 64 65 94 63 63 94 80 82 76 71 82 61 57 61 55 72 95 85 64 86 55 67 62 80 51 65 78 94 80 81 94 73 63 95 90 63 95 91 87 60 83 64 79 83 74 94 96 89 76 63 74 91 94 83 58 63 84 84 72 68 93 91 82 91 70 83 75 96 76 86 73 73 75 94 97 83 97 64 68 78 81 87 78 69 63 71 92 86 68 67 82 87 63 86 91 73 90 79 74 63 93 97 90 76 87 83 65 91 68 65 84 73 87 98 78 64 82 85 90 81 92 65 77 8264 73 84 58 76 78 94 77 67 95 61 84 75 69 72 90 93 72 94 73 93 73 83 90 90 69 72 88 94 74 88 63 88 76 66 76 56 72 75 82 82 74 94 89 87 60 65 84 85 73 75 84 66 70 75 79 74 78 63 85 74 64 91 94 79 70 55 95 83 69 93 94 74 73 85 85 83 79 95 71 81 63 70 79 95 86 85 92 87 74 92 78 85 70 93 ];>> A1=r(1)*A(:,1);>> A2=r(2)*A(:,2);>> A3=r(3)*A(:,3);>> A4=r(4)*A(:,4);>> A5=r(5)*A(:,5);>> S=[A1,A2,A3,A4,A5]S =>> T=sum(S,2)/5 T =附录3)。