承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。
如有违反竞赛规则的行为,我们将受到严肃处理。
我们参赛选择的题号是(从A/B/C/D中选择一项填写):X 我们的参赛报名号为(如果赛区设置报名号的话):xxxxxxxx 所属学校(请填写完整的全名):集美大学参赛队员(打印并签名) : 1. 吴培基光电0913 20095360282. 刘伟权数学0912 20095300553. 陈巧婷数学0912 2009530035指导教师或指导教师组负责人(打印并签名):日期: 2011 年 7 月 31 日赛区评阅编号(由赛区组委会评阅前进行编号):编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):2011年福建高考志愿填报建议摘要:在每一年的高考志愿填报中涉及到很多随机因素和策略,考生往往不知道如何科学的填报志愿,本文在提取大量数据的基础上,主要解决的是计算出考生对应分数填报其感兴趣的高校被录取的概率。
在综合考虑每年的各高校的录取分数线及平均分,运用概率统计和模糊数学的方法,将学校往年的录取分和考生的原始分转化为标准分,以排除每年考试的难易程度带来分数波动的影响。
另外,运用层次分析法将各种因素纳入考虑算出权重。
最后计算被录取的概率。
最后,根据我们的研究分析,对考生填报志愿给出建议。
关键词:高考志愿概率统计模糊数学层次分析标准分权重目录一、问题重述二、问题分析三、模型假设四、模型建立五、模型应用六、给考生的建议七、模型推广与评价八、参考文献一、问题重述在每年的高考结束后,考生和家长就投入到了紧张的志愿填报之中。
福建省是知分填报志愿的,也就是考生是在知道了自己的成绩、排名以及本一、本二线后才填报志愿的。
考生和家长往往通过多种渠道去了解当年招生政策及高校的招生信息,特别是往年招生院校的招生数量、报考人数、录取的最高成绩、平均成绩、最低成绩及录取情况,找到与自己分数相差较小的高校,作为自己填报志愿的重要参考。
最后再通过学校的声誉、地理位置、专业好坏及难度、就业等情况最后确定报考志愿。
根据最近5年各个高校的录取情况,给2011年考生提出一个合理的填报志愿(以福建省为例),分别根据文理科情形从500分至650分,分10分给出建议。
二、问题分析每年都会有考生因为错估自己进入某高校的概率而落榜,所以我们要通过建立关于高考志愿填报的数学模型,来帮助考生计算自己进入心仪的学校的概率。
在志愿的填报过程中,往年的信息是最重要的参考,我们需要根据往年的数据来得出今年自己考上想要报考的学校的概率大小。
数据来源和初步处理这个数学模型的构造的特点是数据量分散,而且数据量大,所以我们建立该模型时最先考虑的问题是数据的查找和筛选。
我们选取了23个省、直辖市的47所高校,对其2006-2010年5年的文理科方面在福建省的招生人数、最高分、最低分、平均分进行分析。
我们选取的高校见以下分布图:关于学校的选取,我们认为清华、北大这两所高校每年在福建省的招生人数及分数较为稳定,我们没将他们列入讨论范围;另外,由于我们所建立的模型是针对福建考生的,所以我们选取的高校中,福建省的高校占有率相比于其它省份会高出一点;再次,我们尽量选取了沿海与内陆的大学等同比例。
这样就可以使我们选择的高校更具有代表性。
由于,考生的考试成绩是基本符合正态分布的,所以我们选取了各个高校的最高分、最低分、平均分以及福建省当年的重点线和当年的最高分,用来对正态当年福建省的考生的成绩分布作个大概的估计。
从而建立数学模型,从而估计某一学生进入某高校的概率。
三、模型假设1.这5年来各高校的相对录取分数没有受到录取比例、招生政策的影响;2.这5年来各校对考生的吸引力没有发生变化;3.考生通过网络获取各高校的信息是全面和权威的;4.考试根据各高校的信息做出的主管数据可以真实的反映考生的意愿。
四、模型建立(一)基于概率统计的估计录取概率模型:1)我们考查福建省2010年的高考理科分数段与人数分布:绘出分段人数统计图通过分段人数统计图,我们可以看出图像较符合正态分布的概率密度图像。
进行标准正态化2)进行标准化由标准化公式:(,)(0,1)XN Z N x z μσμσ→-=知道进行标准化最重要的是两个参数,即期望μ和标准差σ。
对于进行数据分析,比较容易得到的数据是省重点线key x 和省最高分max x 。
由于划重点线对应的是重点院校的招生比例,大体上比较稳定。
以福建为例,基本上是总人数的14%,大体上比μ高出1.3σ,而根据3σ法则,状元的分数比μ高3σ,实际上由于有最高分数的约束,不会达到,所以设置为2.8σ。
于是,5.1max 'keyx x -=σσμ3.1'-=key x 所以得到粗略的标准化公式:3.15.15.1)5.13.1('max max max ''+⨯--=--⨯--=-=keykey keykeykey x x x x x x x x x x x z σμ由于我们所关心的仅仅是不同x 标准化后的大小,所以略去常数1.3,并且为观察方便我们将区间平移并放大到以500为中心的区域,即修改标准化公式为:'max 500500key keyx x z x x η-=⨯⨯+-设置的参数max keyx x ησ-=,表示该省上重点线的难度。
考查几组得到分数分布的考生情况,验证了标准化公式的正确性,我们可以估计福建省的η值,η=1.5。
进行标准化的最大好处是去处了某省某年由于考题难易造成的分数线的波动,从而可以进行某校在某地区各年录取情况的横向比较。
对录取平均分也进行如此处理,对各高校数据依次进行如下处理1.分布假设检验由于排除难易程度造成的波动,标准化后的成绩大体上符合正态分布。
使用Jarque-Bera检验可以看出,百分之九十五以上的数据均符合正态分布。
2.均值方差分析对于填报学校最重要的指标就是分数线的均值和标准差了,特别是标准差表明了该学校录取成绩的随机变化程度,显得更加重要。
对大量数据进行处理,发现不同学校在不同省市的标准差与该校的招生人数、以及均值有一些规律性的联系。
经过分析可以发现有以下几点规律:(1)平均分比录取线有更好的稳定性。
这一方面是正态分布固有的特点,同时也说明每个学校每年的整体生源情况并不像录取分数线所显示的那样大。
所以对于追求该校好的专业的同学更应该关注平均分数的变化。
(2)分数越高分数波动越大,分数较低时招生人数多少不太影响分数的波动。
这是由于低分数的学校由于有录取分数线的限制,其波动有一个下限。
(二)基于模糊判决的院校选择:对于院校的选择,我们用模糊层次分析法:图2 高考志愿模型层次图说明:决策层A:通过对个人因素的分析,考虑到各方面的社会因素,再广泛地征询家长、教师、朋友同学等最后作出填报或不填报某一学校(或专业)的决策。
因素层B:B1 个人因素(包括子因素层:C1、C2);B2:他人因素(包括自因素层C3、C4);B3 社会因素(包括子因素层C5、C6、C7)。
子因素层C:C1:个人兴趣、爱好;C2:该(院校)专业容易学;C3:家长的影响;C4:老师的影响;C5:学校的声誉(办学条件、知名度);C6:专业对口、工作岗位收入高、社会地位高、工作舒适;C7:该学校处于大中城市,校园环境幽雅。
模糊多级综合评判的数学描述我们利用模糊综合评判法对选报高考志愿进行二级综合评判。
所谓模糊综合评判是指运用模糊数学中模糊统计的方法,通过影响某事物各个因素的综合考虑,对其做出科学的评判。
图3 模糊推理示意图确定因素集设评判对象具有n 种属性,把影响评判对象的每一属性称为一个因素, n 个因素组成集合称为因素集。
令总目标的因素集为A ,即A = ( B1 ,B2 , ……, Bn) (此模型中n = 3) , Bi ∩Bj =φ( i ≠j) ;各一级指标的因素集为Bk ,即Bk = ( Ck1 , Ck2 , ……,Ckmk) ( mk 为第k 个一级指标的二级指标数) ( k =1 ,2 , ⋯, n) 。
确定评语集模糊综合评价结果一般是用一个模糊集V 表示,各评价结果组成的分明集称为评语集,文中指方案层组成集合, 记V = ( V1 , V2 , ……, Vi , ……Vm) , Vi 表示第i 个方案。
指标体系权重的确立为确立各因素的权重,可采用直接评分法、功能评分法、二项系数法、AHP 法或DELPHI 等方法。
设A = ( B1 , B2 , ……Bi , ……, Bn) 的权重为W =( W1 , W2 , ……, Wi , ……, Wn) ( Wi 为因素Xi 在X 中的比重) ,0 ≤Wi ≤1 ,11nii W==∑ , Bk = ( Ck1 , Ck2 , ……,Cki , ……, Ckmk) , 相应权重为Wk = ( Wk1 ,Wk2 , ……, Wki , ……, Wkmk) ( Wki 为指标Cki 在Bk 中的比重),101,1km ki ki i W W =≤≤=∑,k = 1 ,2 ,……, n 。
隶属度及模糊评判矩阵的确定定出Xk 的每个因素Ckj 对于m 个评判集的隶属度( kj1r , kj2r , ⋯, kjm r ) , mk 个因素的隶属度可用mk ×m 阶模糊评判矩阵k R 表示。
确定kji r :由s 个专家组成评判组, 其权向量W = ( W1 , W2 , ⋯,Wi , ⋯, Ws) , 11si Wi ==∑, 每人针对评判集给Bk 的每个因素Ckj 一个评定值()[0,1](1,2,,)t ji r t s ∈=,对所有专家的评定值进行如下加权处理:()1st ji ji k i r Wi r ==⨯∑,由此可得到Bk 的模糊评判矩阵Rk111212122212(1,2,,,)ji k rk rk rk m rk rk rk m Rk r m rkmk rkmk rkmkm k i n ⎡⎤⎢⎥⎢⎥=⨯=⎢⎥⎢⎥⎣⎦=模糊评判一级评判先由最低层指标开始,以Bk 的二级指标的权重向量Wk 与其模糊评判矩阵Rk 进行模糊矩阵合成运算,可得出对Bk 的二级指标集的判断向量12*(,,,)(1,2,,,,)k k k k k km P W R p p p k i n ===这里*代表模糊合并运算算子,可根据实际情况选择主因素决定型、主因素突出型、加权平均型等。