成绩评定表课程设计任务书摘要21世纪信息技术迅猛发展,给人类的生产生活带来了深远的影响,无疑我们已经身处在一个信息化时代,信息的发展快慢在一定程度上决定了我国的发展,因此我国需要大量的信息人才,信息人才的培养至关重要,对此我们调查了某学校信息学院的学生汇编成绩,利用概率论与数理统计的知识对其进行系统的分析,为学校培养高素质的信息人才提供依据,概率论与数理统计作为数学中一个重要部分,在生活中的应用越来越广,同样也在发挥着越来越广泛的作用,现实生活中国存在着许多偶然现象,但这些偶然并不是没有规律的,概率论与数理统计将这蕴含在其中的规律找出,方便了人们的生产生活。
而假设检验和方差分析本在这门学科中有着不可小视的重要性。
本文就是利用了假设检验和方差分析来对学生成绩进行分析,首先对学生汇编成绩的分布进行假设,其次利用皮尔逊2 对所得的分步进行检验,结合Matlab 数据处理软件与Excel数据处理软件求出想要得到的结果,最后用单因素的方差分析判断学生汇编课设等级对学生汇编成绩的影响,从而得到学生实际操作能力跟理论结合的情况。
关键词:假设检验;单因素方差分析;Matlab;Excel;目录1 设计目的 (1)2 设计问题 (1)3 设计原理 (2)4 设计程序 (5)4.1 问题一的解决 (5)4.1.1 做出直方图 (5)4.1.2 做假设检验 (6)4.1.3 检验原假设 (8)4.2 问题二的解决 (10)4.2.1 计算平方和 (10)4.2.2 比较F值和临界值 (11)5 结果分析 (12)6 设计总结 (12)致谢 (13)参考文献 (14)某校学生汇编语言成绩单因素方差分析1 设计目的为了更好的了解概率论与数理统计的知识,熟练掌握概率论与数理统计在实际问题上的应用,并将所学的知识结合Matlab软件和Excel数据处理软件对数据的处理解决实际问题。
本设计是利用假设检验、方差分析等对学生的汇编成绩进行分析,并利用Matlab软件和Excel数据处理软件进行求解。
2 设计问题21世纪信息技术迅猛发展,给人类的生产生活带来了深远的影响,无疑我们已经身处在一个信息化时代,信息的发展快慢在一定程度上决定了我国的发展,因此我国需要大量的信息人才,信息人才的培养至关重要,为此我们调查了某大学信息学院学生的汇编成绩,并对其进行分析,要求如下:1、分析汇编成α);2、为了查看学生动手操作绩与学生人数之间的关系(取显著性水平05=.0能力与理论结合的情况,分析汇编课程设计对汇编成绩之间的影响。
表2.1 不同学生课设等级下的学生汇编成绩表Array(注:等级越高课设成绩越好)3 设计原理首先用Excel 做出该组数据的直方图,由图大致分析一下两者之间的关系,认为其大致服从正态分布,设总体X 服从N ),(2σμ,其中μ和σ>0都是未知参数,样本观测值为n x x x .....21,似然函数∏=--=ni x i eL 12)(2221),(σμσπσμ取对数得∑=----=ni i x n n L 122)(21ln )2ln(2),(ln μσσπσμ对μ及σ求偏导数,并让他们等于零,得0)(1ln 12=-=∂∂∑=ni ixL μσμ0)(1ln 123=--=∂∂∑=n i i n x L σμσμ借此方程组得μ及σ的最大释然估计值分别是x x n ni i ==∑=∧11μ,~12)(1σσ=-=∑=∧n i i x x n 。
接着将x 以及~σ算出,然后在计算X 落在各个子区间内的概率)...3,2,1(l i p i =。
为了检验原假设0H ,即检验理论分布与统计分布是否符合,我们把偏差)...2,1(l i p f i i =-的加权平方和作为理论分布与统计分布之间的差异度: ∑=-=li i ii p fc Q 12)(,其中i c 为各个偏差i i p f -的权,如果取ii p nc =,则当∞→n 时,统计量Q 的分布趋于自由度为1--=r l k 的2χ分布,其中l 十分不自取间的个数,r 是理论分布中需要利用样本观测值估计的未知参数的个数。
通常把统计量Q 记作2χ,即∑=-=li i i i p p f n 122)(χ为了便于计算,上式可以写成∑=-=li i i i np np m n 122)(χ。
{对于给定的显著性水平α,查表可知2χ的临界值)1(2--r l αχ,使αχχα=-->)]1([22r l P .如果由实验数据计算得到的统计量2χ的内测之大于)1(2--r l αχ,则在显著性水平α下拒绝原假设0H ;否则,接受0H .应当指出,利用2χ你和检验准则检验关于总体分布假设时,要求样本容量n 样本观测值落在各个子区间的频数i m 都相当大,一般要求50≥n ,而()l i m i ,...2,15=≥,如果某些字区间内的频数太小,则应适当地把响铃的两个或几个子区间合并起来,使得合并后得到的子区间内的频数足够大。
当然,这是必须相应地减少统计量2χ分布的自由度。
对于单因素方差分析,我们设因素A 有l 个水平,....,21l A A A 在水平i A 下的总体i X 服从正态分布N ),(2σμi ,l i ,...2,1=,在水平i A 下进行i n 次试验,l i ,...2,1=;假定所有的实验都是独立的,设得到的样本观测值ij x ,如下表:因为在水平i A 下的样本ij X 与总体分布i X 服从相同的分布,所以有ij X ~N ),(2σμ,l i...2,1=,记μμα-=i i ,要检验的原假设是0:210====l H ααα ,设第i 组样本的样本均值为),...2,1(l i x i =,即∑==in j ij ii x n x 11。
于是,总的样本均值∑∑∑=====li i i l i n i ij x n n x n x i 11111∑∑==-=li n j ij T ix x S 112)(,把T S 分解,得到∑∑∑===+=-+-=l i e A n j i ij li i i T S S x x x x n S i11212)()(,由于A S 和e S 独立,现在考虑统计量).,1(~)/()1/(l n l F l n S l S F e A ----=对于给定的显著性水平α,查表可知的临界值),1(l n l F --α,如果有样本观测值计算得到的统计量F 的观测值大于),1(l n l F --α,则在显著性水平α下拒绝原假设0H ,如果统计量F 的观测值不大于),1(l n l F --α,则接受原假设0H ,即认为因素A 的不同水平对总体无显著影响。
4 设计程序4.1 问题一的解决4.1.1 做出直方图用Excel 做出各成绩段学生人数分布直方图,如下:图4.1.1 各成绩段学生人数分布直方图由上图可以看出学生成绩以及各成绩段中的学习人数大体上成正态分布。
4.1.2 做假设检验要求检验的原假设是:0H :X ~N ),(2σμ已知x =∧μ,~12)(1σσ=-=∑=∧n i i x x n ,250=n ,把各个分数段的中点值取作i x ,计算参数μ 及σ 的最大释然估计值。
将数据输入到Excel 中利用公式,得到9.69==∧x μ,5.10)(112≈-=∑=∧ni i x x n σ,如下图图4.1.2图4.1.3 图4.1.4 图4.1.5表4.1.1 Excel 图注4.1.3 检验原假设现在检验原假设:)5.10,9.69(~:20N X HX 的概率密度5.220)9.69(225.101)(--=x ex f π注意到正态区间是),(+∞-∞,所以第一个区间应扩大为),95(+∞,最后一个区间应扩大为)45,(-∞,运用公式()⎪⎭⎫⎝⎛--⎪⎭⎫ ⎝⎛-=<<σμφσμφ1221x x x X x P ,通过查询正态分布表可以算出X 落在各个分数段的概率i p (i =1,2,3,…),得到的数据如下表:再利用皮尔逊2χ拟合检验准则来检验假设是否成立,已知∑=-=li i iinp np m 122)(χ由此得705.02≈χ因为合并后子空间的个数10=l ,利用观测值估计的参数个数2=r ,所以自由度71210=--=k对于给定的05.0=α,查表可知1.14)7()(205.02==χχαk因为)7(205.02χχ<,所以接受原假设0H ,即可认为学生成绩服从正态分布)5.10,9.69(2N 。
用Matlab 画出其图像,输入如下:x=40:1:100;y=exp(-(x-69.9).^2/220.5)/10.5*(2*pi)^0.5; plot(x,y,'b') 输出图像如下:40506070809010000.050.10.150.20.25图6 学生成绩正态分布图所以学生汇编成绩服从X ~N )5.10,9.69(2的正态分布4.2 问题二的解决研究学生汇编课设等级对汇编成绩的影响,我们用单因素方差分析来解决。
4.2.1 计算平方和根据总偏差平方和公式 ∑∑==-=l i n j ijT ix xS 112)( 、组间平方和公式∑=-=li i i A x x n S 12)( 、误差平方和公式A T e S S S -=,用Matlab 将其总偏差平方和T S ,组间平方和A S ,以及误差平方和e S 的观测值算出,如下:x=[67,63,55,47,79,64,81,70,80,87,86,78,93,80,88,89]; a=[67,63,55,47]; b=[79,64,81,70]; c=[80,87,86,78];d=[93,80,88,89];f1=sum((x(1,:)-mean(x)).^2);f2=(sum((mean(a)-mean(x))^2)+sum((mean(b)-mean(x))^2)+sum((mean(c)-mean (x))^2)+sum((mean(d)-mean(x))^2))*4; st=f1 sa=f2 se=f1-f2 输出: st =2.5999e+003 sa =2.0272e+003 se = 572.7500因此可知9.2599=T S ,2.2027=A S ,75.572=e S 4.2.2 比较F 值和临界值根据公式)/()1/(l n S l S F e A --=,得到151.1812/75.5723/188.2027≈=F根据计算结果,写出单因素试验的方差分析如下:由于151.18)12,3(01.0≈>F F 所以学生汇编课设等级对学生汇编成绩有着显著影响。