数学课程的成绩分析(数模大作业)2012年4月西安电子科技大学学报(自然科学版) Apr.2012第X卷第X期JOURNAL OF XIDIAN UNIVERSITY Vol.XX No.X数学课程的成绩分析摘要:本文讨论了B题中给出的对大学数学课程的成绩分析的一种分析方法,根据题目中提供的甲乙两专业4门数学学科的成绩,对成绩进行分类汇总,再通过数理统计的方法进行对成绩的分析,运用Excel、Matlab绘出图表,直观的分析甲乙专业,各数学学科的一些统计量。
再查找数学教育的相关资料,建立合理的数学水平评价模型。
最后建立数学学科之间的相关回归模型,利用Matlab进行回归检验,从而讨论各个数学学科之间的关系。
关键词:层次分析法统计回归方法一元线性回归数学水平评估模型1问题重述附件是甲专业和乙专业的高等数学上册、高等数学下册、线性代数、概率论与数理统计等三门数学课程的成绩数据,请根据数据分析并回答以下问题:(1)针对每门课程分析,两个专业的分数是否有明显差异?(2)针对专业分析,两个专业学生的数学水平有无明显差异?(3)高等数学成绩的优劣,是否影响线性代数、概率论与数理统计的得分情况?(4)根据你所作出的以上分析,面向本科生同学阐述你对于大学数学课程学习方面的看法。
2模型假设和符号说明2.1模型假设1)甲专业24号同学高数I成绩433,不属于0-100分,所以当无效数据处理,不考虑它的影响。
2)考试成绩反映的是学生的真实水平。
3)高数成绩和线性代数、概率论与数理统计有相关关系。
4)将高数成绩定义为将高数I的成绩和高数II的成绩取平均。
5)两个专业的老师教课水平是一样的。
6)学生本科前的数学水平是相近的。
7)两专业的人数可以真实反应学生水平。
2.2符号说明x:把高数成绩作为一元线性回归模型的自变量。
第X 期 张翰宗等:数学课程的成绩分析1 1y :把线性代数成绩作为一元线性回归模型的因变量1。
2y :把概率论与数理统计成绩作为一元线性回归模型的因变量2。
3210ββββ、、、:一元线性回归模型的回归系数。
3210ˆˆˆˆββββ、、、:一元线性回归模型的回归系数的估计值。
ε:随机误差(均值为0的正态分布随机变量)2r :相关系数的平方。
3 问题分析3.1 问题(1)分析问题要求针对每门课程分析两专业的分数差异,因此分成4门课,每门课再分甲乙专业,然后用Excel 制表,画图,算出其中的数理统计量,最后通过比较各个统计量和比较图表来得到结论。
3.2 问题(2)分析将成绩按照专业分开进行对照比较,定义一个模型来评估学生的数学水平,建立数学水平评估模型后再将两专业的成绩、各个统计量带入模型中,然后求出结果再经行比较得出结论。
3.3 问题(3)分析将高数成绩分别与线性代数成绩和概率论与数理统计成绩进行相关性分析,建立一元线性回归模型,利用Matlab 处理数据,求出相关系数、回归系数的点估计和区间估计并检验回归模型的可靠性,进行残差分析。
3.4 问题(4)分析结合问题(1)至问题(3)然后对其结果进行总结分析。
4 模型建立与求解4.1 问题(1)求解将附件数据中甲乙专业按照数学学科分开,用Excel 统计出每科甲乙两专业人数、最高分、最低分、极差、众数、中位数、平均分、标准差、及格率、优秀率等统计量,再统计甲乙各个分数段的频数,作出频率分布直方图,再根据平均分和标准差作出成绩的正态分布图,观察比较两者是否基本吻合,一般情况下成绩会遵循正态分布,由此可以判断试卷出的题目有无过难或过易。
4.1.1 甲乙专业高数成绩的差异分析表1 甲乙专业高数I 成绩统计结果人数 最高分 最低分 极差 众数 中位数 平均分 标准差 及格率 优秀率第X期张翰宗等:数学课程的成绩分析2数I 2 1 1 4% 9% 乙专业高10100 0 1060 66 69.313.895.321.3表2 甲乙专业高数II成绩统计结果人数最高分最低分极差众数中位数平均分标准差及格率优秀率甲专业高数II 15396 40 56 60 6770.1210.2396.73%18.95%乙专业高数II 10897 0 97 64 6565.4314.3389.81%12.04%通过表1分析发现:甲专业高数I的均分要高于乙专业,但标准差也大于乙,说明离散程度甲要大一些,既分数分布更为分散些,再比较及格率和优秀率,及格率基本差不多,但优秀率上甲要高于乙。
再分析表2发现:甲乙专业的极差差距比较大,均分还是甲专业要大于乙专业,标准差是甲要小于乙,说明乙的分数分布更为分散,甲专业的及格率和优秀率普遍要比乙专业的高。
因此仅由表1和表2的统计结果可以得出一个结论:综合来看甲专业的高数成绩要好于乙专业的高数成绩。
图1 甲专业高数I成绩频率分布直方图和正态分布示意图图2 乙专业高数I成绩频率分布直方图和正态分布示意图利用Excel作出甲乙专业关于高数成绩的频率直方图和正态分布图,根据图1分析:甲专业学生落在60-65分数段的频率最大,再比较甲乙专业高数I成绩的频率分布直方图和正态分布曲线,发现频率最高的分数段都要落后于平均分一点,都是在60-65分这个分数段,而图中50-60分这个分数段频率为0,由此分析可能是老师把一些不及格的同学拉到及格了,使得图上显示的结果不太符合一般考试的成绩分布状态。
第X期张翰宗等:数学课程的成绩分析 3图3 甲专业高数II成绩频率分布直方图和正态分布示意图图4 乙专业高数II成绩频率分布直方图和正态分布示意图分析图3和图4:发现甲乙专业高数II成绩的频率分布直方图基本上落在正态分布曲线内,说明成绩的分布还是比较理想,甲乙专业都是在65-70这个分数段频率最大,从图中可以清楚观察出,甲专业分数的分布更为集中些,这与表2的分析结果是相符的。
最后通过图1-图4可以得出结论:甲专业的学生高数成绩要好于乙专业的。
分数的分布也更为平均。
4.1.2甲乙专业线性代数成绩的差异分析表3 甲乙专业线性代数成绩统计结果人数最高分最低分极差众数中位数平均分标准差及格率优秀率甲专业线代15398 0 98 60 7270.6814.6195.42%24.84%乙专业10100 0 1060 6970.113.195.320.3通过表3分析发现:乙专业有满分的,并且两个专业的均分也相差不大,标准差是甲专业大于乙专业,甲专业的成绩相对于乙要分散些,及格率两专业也相差不大,优秀率甲专业要好于乙专业。
因此仅由表3的统计结果可以得出一个结论:综合来看甲专业的线代成绩和乙专业的线代成绩相仿。
第X期张翰宗等:数学课程的成绩分析4图5 甲专业线代成绩频率分布直方图和正态分布示意图图6 乙专业线代成绩频率分布直方图和正态分布示意图分析图5和图6:发现甲专业线代成绩的频率分布直方图基本上落在正态分布曲线内,说明成绩的分布还是比较理想,而乙专业线代成绩的频率分布直方图和正态分布曲线还是有些差距的。
甲专业在55-60分数段频率最大,而且在55-90分数段中成绩的分布较为均匀,乙专业是在55-60分数段和65-70分数段频率最大。
4.1.3甲乙专业概率论与数理统计成绩的差异分析表4 甲乙专业概率论与数理统计成绩统计结果人数最高分最低分极差众数中位数平均分标准差及格率优秀率甲专业概率15397 22 75 90 7675.0914.0494.12%39.22%乙专业概率10897 0 97 60 7574.4514.1196.30%38.89%通过表4分析发现:甲乙专业的最高分相同,但乙专业有0分的学生,甲乙专业的均分相近,标准差相近,及格率是乙专业好于甲专业,但优秀率是甲专业好于乙专业。
因此仅由表4的统计结果可以得出一个结论:综合来看甲专业的概率论与数理统计成绩和乙专业的概率论与数理统计成绩相仿。
第X 期 张翰宗等:数学课程的成绩分析5图7 甲专业概率成绩频率分布直方图和正态分布示意图 图8 乙专业概率成绩频率分布直方图和正态分布示意图分析图7和图8:发现甲专业概率成绩的频率分布直方图和正态分布曲线还是有微小的差距,乙专业概率成绩的频率分布直方图基本上落在正态分布曲线内。
甲专业在60-70分数段和75-90分数段的分布比较平均,乙专业在85-90分数段频率最大。
4.2 问题(2)求解4.2.1 数学水平评估模型建立建模背景:基于我们学校对这三门课程的一个学分安排——高数I 为6学分,高数II 为6学分,线性代数为3学分,概率论与数理统计为3学分。
总共为18学分,因此建立一个加权平均的模型来定义学生的数学水平。
建立如下模型:616131II 31I ⨯+⨯+⨯+⨯=学生概率成绩学生线代成绩成绩学生高数成绩学生高数学生数学水平4.2.2 数学水平分析求解将甲乙专业分开,分别计算各个学生的数学水平,得到相关统计量,并绘制表格:表5 甲乙专业数学水平统计结果人数 最高分最低分 极差 众数 中位数 平均分 标准差及格率 优秀率 甲专业数学水平 15294.50 45.50 49.00 70.67 70.6771.55 9.5194.74%16.45% 乙专业数学水平 10895.330.0095.33 67.50 67.8369.0311.70 93.52% 13.89%从表5可以看出甲专业极差小于乙专业,众数、中位数、均分都要高于乙专业,而起标准差要小于乙专业,说明数学水平分布更为集中,并且甲专业的及格率和优秀率都要好于乙专业。
由此可以粗略的得出一个结论:甲专业的数学水平要好于乙专业。
为了能更近一步的了解甲乙两专业的数学水平情况,我们绘制了2张甲乙专业单独的各个数学学科的频率图,并希望从图中有所发现:第X 期 张翰宗等:数学课程的成绩分析6图9 甲专业数学学科成绩频率分布图 图10 乙专业数学学科成绩频率分布图 图11 甲乙专业数学水平频率分布图通过比较图9和图10,发现:甲专业的数学水平更为集中,比较集中在65-85这个分数段,数学水平在75-80分数段的人数最多,而乙专业的数学水平相比就比较分散些,数学水平在70-75分数段的人数最多。
就4门数学单科的成绩频率分布而言,在问题(1)的求解中已经详细的讨论过了,再由图11比较甲乙专业的数学水平,这里可以更加直观的观察到甲乙专业间的数学水平差异。
因此得出结论:甲专业学生的数学水平要比乙专业高些,而且多数集中在75-85分数段,反观乙专业学生的数学水平就低一些了。
4.3 问题(3)求解4.3.1 一元线性回归模型建立由于是分析高数成绩与线代成绩、概率成绩的相互影响关系,因此可以建立关于高数-线代成绩的一元线性回归模型和高数-概率成绩的一元线性回归模型。
⎪⎩⎪⎨⎧==++=++=2322101,0σεεεββεββD E x y x y关于模型参数的估计:有n 组独立观测值,(x 1,y 1),(x 2,y 2),…,(x n ,y n )设⎩⎨⎧===++=相互独立且,n i i i i D E ni x y εεεσεεεββ..., ,0,...,2,1,21210 记 ()∑∑==--===ni i i n i ix y Q Q 12101210),(ββεββ最小二乘法就是选择0β和1β的估计0ˆβ,1ˆβ使得),(m in )ˆ,ˆ(10,1010ββββββQ Q = 解得 ⎪⎩⎪⎨⎧--=-=22110ˆˆˆx x y x xy x y βββ 或 ()()()∑∑==---=ni ini i ix xy y x x1211ˆβ其中∑∑====n i i n i i y n y x n x 111,1,∑∑====n i i i n i i y x n xy x n x 11221,1第X 期 张翰宗等:数学课程的成绩分析7 得出回归方程为:)(ˆˆˆˆ110x x y x y -+=+=βββ4.3.2 模型求解与检验因为高数分为高数I 和高数II ,所以依据开始的假设,取两者均值来代替高数成绩,还有由于甲专业24号高数I 成绩433,视作无效数据,因此样本容量从原来的261变为260。