承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。
如有违反竞赛规则的行为,我们将受到严肃处理。
我们参赛选择的题号是(从A/B/C/D中选择一项填写):我们的参赛报名号为(如果赛区设置报名号的话):05所属学校(请填写完整的全名):延安大学参赛队员(打印并签名) :1. 彭瑞2. 呼建雪3. 朱培育指导教师或指导教师组负责人(打印并签名):日期: 2012 年 8 月 27 日赛区评阅编号(由赛区组委会评阅前进行编号):编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):关于课程关系量化分析的数学模型摘要本文探讨研究了关于某高校两个专业四门课程分数、学生学习水平的差异显著性以及课程间相互影响的情况。
首先我们对两个专业的各科成绩分别统计了平均值、标准差、及格率以及优秀率这些统计量值,又根据这些数据作出了特性指标矩阵;然后采用模糊聚类分析中的最优划分法得到了聚类分类结果,得到结论为:两专业的高级程序设计语言分数差异性显著,其他三门科目均没有显著差异。
接着我们根据课程间的联系,采用层次分析法得到各个科目在总成绩中所占的权重,即得到关于衡量学生学习水平的总成绩模型:4j 3j 2j1j0.2323x 0.3619x 0.6090x0.6664x+++=y然后利用单因素方差分析法得到专业对学生学习水平影响的显著性05.0132.0>,即两个专业学生的学习水平无明显差异。
对于问题(3),我们直接利用SPSS 软件中的回归分析法得到高级程序语言设计、离散数学两门课程学习的优劣会影响到数据结构和数据库原理的学习。
最后,综合以上分析得到对于专业主干课的学习,我们应该认真学好专业基础课,以便为后续课程的学习打好基础。
关键词:模糊聚类分析 层次分析 单因素方差分析 回归分析一.问题重述附件一、二分别给出了某高校两个专业的高级语言程序设计、离散数学、数据结构、数据库原理这四门课程的期末考试成绩数据,请根据数据分析并解决以下几个问题:(1)分析每门课程两个专业学生的分数是否有明显差异?(2)分析两个专业学生的学习水平有无明显差异?(3)分析说明高级语言程序设计和离散数学两门课程学习的优劣是否影响数据结构和数据库原理两门课程的学习?(4)根据1~3问所作出的分析,面向全校本科生同学,撰写一篇1000字左右的论文,阐述你们对于专业主干课程学习方面的看法。
二.问题分析2.1针对于问题(1):该题要求我们针对两个专业的每门课程的分数分析其差异性,所以对于四门课程,我们利用Excel计算出每科成绩相应的统计量,然后利用模糊最优划分法比较对应的统计量值得到差异显著性的相关结论。
2.2针对于问题(2):由于要用成绩来衡量学生的学习水平,所以首先我们采用层次分析法得到各科成绩在总成绩中所占的权重,然后再利用单因素方差分析法作出总成绩受专业因素的影响情况,即可得到两个专业学生学习水平的差异性。
2.3针对于问题(3):按实际学习情况来看,高级语言程序设计和离散数学两门课程作为基础课,对后续课程的学习会有一定的影响。
为了进一步说明高级语言程序设计和离散数学两门课程的优劣是否对数据结构和数据库原理两门课程有影响,我们不考虑专业的影响,仅从这四门课程成绩的相关性进行考虑,即高级语言、离散数学与数据结构成绩的相关性,高级语言、离散数学与数据库原理成绩的相关性。
利用SPSS软件中的回归分析进行求解。
2.4针对于问题(4):综合分析问题(1)—(3)的结论,得到一些关于专业主干课程的学习建议。
并按要求撰写1000字左右的建议信。
三.模型假设1.对0分成绩视为缺考处理,即该项数据为无效数据;2.学生与学生之间、班级与班级之间的成绩无相互影响,即为独立的;3.学生的学习水平仅有成绩来衡量,该论文不考虑其他因素。
五.模型建立与求解5.1问题(1):将附件所给数据利用Excel统计出两个专业每门课程的平均分、标准差、及格率、优秀率等统计量,为了对这些统计量进行分析比较,我们采用模糊逐步聚类分析给出分类标准,由此即可得到两个专业每门课程学生分数的差异性。
首先作出相应的统计量值:表1:两专业高级语言程序设计分数统计量表表2:两专业离散数学分数统计量表表3:两专业数据结构分数统计量表表4:两专业数据库原理分数统计量表然后根据上表中的平均值、标准差、及格率以及优秀率构造特性指标矩阵如下:⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣⎡1.2812.9404.1409.7006.232.9717.1215.7538.1442.9561.1468.7015.1226.9631.1185.7015.973.9622.1012.7054.665.9033.1404.6622.2212.9487.3232.7169.1826.9689.1399.69其中,行依次为专业一、专业二高级程序语言设计、离散数学、数据结构和数据库原理相应的统计量值。
数据规格化:采用最大值规格化后得到:⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣⎡197.043.093.083.0137.0151.098.044.094.043.099.034.094.033.0995.031.093.023.093.044.088.079.097.0195.067.099.042.093.0最后再利用最大最小法构造模糊相似矩阵为:⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣⎡19.085.079.09.0186.084.085.086.0193.079.084.093.0176.074.08.089.089.074.08.06.088.086.077.093.095.088.072.089.076.089.088.095.074.074.086.088.08.08.077.072.089.06.093.089.0187.068.085.087.0167.081.068.067.018.085.081.08.01为了给出聚类划分标准,我们采用最优模糊划分法。
利用其相关公式可得拉格朗日方程为:)1-u (-),(81i 2812∑∑==+=i i ij i i i u x u u L λλ 【1式】对上式分别关于变量i u ,λ求偏导得:⎪⎩⎪⎨⎧=+=∑=0-201-281λiij i i i u x u u 【2式】利用MATLAB 对上式求解,最后可得评价标准集为:[]89.088.087.086.086.087.088.089.0=i u再结合上述的相似矩阵可得聚类分析的布尔矩阵为:⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣⎡1100110000110011000110001101110101110011000010111100110000100001分析该矩阵可得模糊聚类分类为:{}{}28765431,,,,,,x x x x x x x x 和即这两个专业的学生的各科分数中,只有高级程序语言差异性较明显,其他三门科目均没有明显差异。
5.2问题(2):该题要分析两个专业学生的学习水平有无明显差异,由于学习水平要用成绩来衡量,所以要求出四门课程的总成绩。
首先构建一个层次分析模型来求出各科在总成绩中的权重,然后再利用单因素方差分析模型来判断总成绩是否显著相关,将专业看做对成绩的影响因素进行分析。
5.2.1层次分析模型:图1 总成绩的层次分析图取⎥⎥⎥⎥⎥⎥⎦⎢⎢⎢⎢⎢⎢⎣⎡=121213121212122111A ,利用MATLAB 求得A 的最大特征根和它对应的特征根向量(运行程序及结果见附件),分析结果可得:0458.4=λ,它所对应的特征根向量为:9,0.2323)6090,0.361(0.6664,0.=α。
由于对于成对比较矩阵A ,一致性指标为:)1--(n nCI λ=(λ为A 的最大特征根,n 为矩阵A 的阶数) 随机一致性指标为RI ,所以一致性比率为)(RICICR =。
验证:0153.0144=--=λCI ,此时有:09.0=RI1.0017.0)(<==RICICR 所以该矩阵合适,α可以作为各门成绩在总成绩中占的比重。
所以求得总成绩为:4j 3j 2j1j0.2323x 0.3619x 0.6090x0.6664x+++=y 【3式】5.2.2单因素方差分析模型:先用Excel 在表格中根据上述模型计算出各专业的总成绩,然后在SPSS 中打开数据管理窗口,定义变量名专业和总成绩,然后按顺序输入相应总成绩,专业依次定为数值1,2。
然后运行 “分析 -> 比较均值 -> 单因素ANOVA ”进行单因素方差分析,得到如下结果:由上表分析可得:显著性为05.0132.0 ,即由方差分析得这两个专业学生的学习水平无明显差异。
5.3问题(3):为了分析高级语言程序设计和离散数学两门课程的优劣是否对数据结构和数据库原理两门课程有影响,我们不考虑专业的影响,仅从这四门课程成绩的相关性进行考虑,即高级语言、离散数学与数据结构成绩的相关性,高级语言、离散数学与数据库原理成绩的相关性。
直接利用SPSS 软件中的回归分析进行求解。
5.3.1高级语言、离散数学与数据结构分数的相关性:选择“分析—回归—线性”,将因变量“高级语言、离散数学”、“数据结构”分别移至对应的框中,在“方法”中选择“进入”把所有自变量放入回归模型,选择统计量中的“估计、模型拟合度、R 方变化、描述性”四项,点击“选项”选择“使用F 的概率“及“在等式中包含常量”,保存后运行,输出如下结果:ANOVA 总成绩平方和 df 均方 F 显著性 组间 746.573 1 746.573 2.283 .132 组内 84384.073 258 327.070总数 85130.646259对表中的数据分析可得:R表示复相关系数,反应的是自变量与因变量之间的密切程度,R方表示复相关系数的平方,称为决定系数,这里R=0.512,说明数据结构的成绩与高级语言、离散数学的成绩有一定的关系。
上表中p值小于0.05,因此该回归模型有显著的统计意义,即线性回归方程高度显著。
相关性数据结构高级语言离散数学数据结构 1.000 .348 .481Pearson 相关性高级语言.348 1.000 .329离散数学.481 .329 1.000Sig. (单侧)数据结构. .000 .000高级语言.000 . .000离散数学.000 .000 .N 数据结构260 260 260高级语言260 260 260离散数学260 260 260上表的pearson相关性说明高级语言、离散数学、数据结构三者之间存在一定的关系。