当前位置:文档之家› 2012高教社杯全国大学生数学建模竞赛A题论文

2012高教社杯全国大学生数学建模竞赛A题论文

承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。

我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。

我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。

如有违反竞赛规则的行为,我们将受到严肃处理。

我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。

我们参赛选择的题号是(从A/B/C/D中选择一项填写):我们的参赛报名号为(如果赛区设置报名号的话):所属学校(请填写完整的全名):参赛队员(打印并签名) :1.2.3.指导教师或指导教师组负责人(打印并签名):日期:年月日赛区评阅编号(由赛区组委会评阅前进行编号):编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):葡萄酒的评价摘要本文讨论的是葡萄酒的评价,首先把两组品酒员对27种葡萄酒的感官评分的算术平均值作为27种葡萄酒的两组质量得分,然后把每一种葡萄酒的两组得分作为一对数据它们差的值作为一个随机变量的27个取值,因为这27组值可以看成是仅由品酒员的差异引起的,然后利用基于成对数据的检验(t检验)进行显著性检验,得出的结论是两组品酒员的评价结果有显著性差异,然后通过认为品酒员对同一种葡萄酒的评分的方差越小越可信,确定第二组结果更可信。

第二问是通过葡萄酒的质量得分确定葡萄的等级,然后再利用酿酒葡萄的理化指标进行聚类分析得出分类,最后将酿酒葡萄的分类与葡萄酒的评分综合考虑最终得出酿酒葡萄的等级。

第三问先通过主成分分析把多个理化指标转化为几个综合的指标,然后与对应葡萄酒的理化指标做典型性相关分析,得出两者之间的关系。

第四问则是把酿酒葡萄的综合理化指标和葡萄酒的理化指标与葡萄酒的得分做多元线性回归,得出回归方程,最终的出结论可以通过酿酒葡萄与葡萄酒的理化指标来评价葡萄酒的质量。

关键词:基于成对数据的检验主成分分析聚类分析典型性相关分析多元线性回归分析一、问题重述确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。

每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。

酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。

附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。

现要求建立数学模型讨论下列问题:1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。

3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。

4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。

二、问题分析本问题是关于葡萄酒质量分析,首先通过对附录一的观察,先要对其中的数据进行处理,我们采用假设检验中,基于成对数据的检验(t 检验),利用t 检验的方法分别求出第一组和第二组评酒员对红、白葡萄酒总评分,进而求得均值、方差。

利用t 检验所求的t 值是否落在拒绝域内,评定结果是否具有显著性差异。

然后利用两组标准差的均值,通过对两组数据的对比,判断出哪一组结果更可靠,从而解决了问题一。

三、模型假设1 在进行聚类分析和主成分分析时忽略二级指标对于理化性质的影响;2 在对样本进行t 检验室时,要将样本均值作为一对随机变量。

四、符号说明i x :第一组评酒员对一种红葡萄酒评定总分的均值 i y :第二组评酒员对一种红葡萄酒评定总分的均值 j x :第一组评酒员对一种白葡萄酒评定总分的均值 jy :第二组评酒员对一种白葡萄酒评定总分的均值n :葡萄酒种数d :样本均值的观察值is :样本的标准差:F 主成分五、模型的建立与求解5.1问题一5.1.1 对附件一的数据进行整合为了比较两组数据的差异,我们需要在相同的条件下做对比试验,得到一批成对的观察值,然后分析观察数据作出判断。

本题附件一中的数据是成对的,即是两组人对此酒样品评出的两组数据。

首先,我们对两组数据进行了整理,将每个评酒员的各项评分进行求和,再将每组十个评酒员对同一酒样的总评分求平均值。

5.1.2问题一的模型建立与求解一般,设有n 对相互独立的观察结果:()1,1Y X ,()2,2Y X ,…,()n Y X ,n ,令111Y -X =D ,222Y -X =D ,…n n n D Y -X =,则1D ,2D ,…,n D 相互独立。

又由于1D ,2D ,…,nD 是有同一因素所引起的,可认为他们服从统一分布。

今假设()DD i N D 2~σμ,,.21n i ,,,Λ=这就是说1D ,2D ,…,n D 构成正态总体()D D N 2,σμ的一个样本,其中D D 2,σμ未知。

我们需要基于这一样本检验假设:;0:,0:10≠=D D H H μμ分别记1D ,2D ,…,n D 的样本均值和样本方差的观察值为-d ,Ds2,关于单个正态总体均值的t 检验。

知检验问题的拒绝域分别为(显著性水平为05.0=α):(),12/-≥=-n t nS d t a D根据此模型,讨论本题的检验问题,由公式分别求出两组的id ,'i d ,i s ,'i s 公式如下:,11∑=-=ni i D n d.1121∑=-⎪⎭⎫⎝⎛--=n i i d D n s把以上两式代入t 检验方程,根据excel 中的计算数据(见附录),可分别求出第一组和第二组的拒绝域为≥t )26(025.0t 和≥t )27(025.0t .红葡萄酒有二十七种样品,当=a 0.05时,由t 分布表可知()=-12/n t a 0555.2,通过上述计算数据可明显看出 6138.2t =,因为)26(t 2αt ≥,所以拒绝原假设,接受备择假设,即认为两组评分有显著性差异。

白葡萄酒有二十八种样品,当=a 0.05时,由t 分布表可知()=-12/n t a 0518.2.通过上述计算数据可明显看出 5117.2t =因为)26(t 2αt ≥,所以拒绝原假设,接受备择假设,即认为两组评分有显著性差异。

现t的值落在拒绝域内,故认为两组数据有显著性差异。

通过对所有酒样品总分求方差,再对一二组的红白葡萄酒的所有方差求平均值,由所得的数据可明显看出,第一组的方差均值大于第二组的方差均值(见附录)。

所以第二组结果更可信。

5.2.1初步分析通过第一问的求解,我们确定了以第二组数据为葡萄酒质量的理论依据,要根据酿酒葡萄的理化指标和葡萄酒的质量对酿酒葡萄进行分级,根据酿酒葡萄的理化指标进行聚类分析,求出树状图与1问中代表葡萄酒质量的数据进行对比,从而得到酝酿葡萄的分级。

应用SPSS 软件计算结果如下:红葡萄酒树状图白葡萄酒树状图通过树状图和葡萄酒的质量进行综合分析,可把酿酒葡萄分为四级,分别为:红葡萄酒优质酒样品号:2,17,3,20,23,9良好酒样品号:4,24,27,22,20,26,5,21,14,19中等酒样品号:1,25,12,13,10,16一般酒样品号:11,7,18,15,8,6白葡萄酒优质酒样品号:21,22,25,28,10,17,9,5良好酒样品号:24,19,20,18,4,2,7,14,23,1,15中等酒样品号:13,7,26,6,3,2一般酒样品号:16,11,8,125.2 问题三我们利用第二问中主成分分析的结果,和葡萄酒的理化指标进行多元统计分析中的从红葡萄特征值及主成分贡献表可知前八个成分的累计贡献率84.159%,按照累计方差贡献率大于80%的原则,选入了八个主成分。

分别为第一主成分1F 第二主成分2F ……第八主成分8F :30211417.0172.0573.0x x x F ++-=Λ30212512.0380.0558.0x x x F +--=Λ……30218089.0034.0104.0x x x F +++=Λ用主成分可计算出各样品的主成分值。

然后利用酿酒葡萄的各个主成分值和所酿葡萄酒的成分含量,作为两组数据,进行典型相关分析。

5.3 问题四通过第三问的求解,我们了解了酿酒葡萄和葡萄酒的联系,运用SPSS 将酿酒葡萄与葡萄酒的理化指标,与葡萄酒的感官质量得分,进行多元线性回归分析,并得出多元线性方程,进行显著性检验,最终得出结论可以通过酿酒葡萄和葡萄酒的理化指标来确定葡萄酒的质量。

参考文献[1] 胜骤谢式千潘承毅,概率论与数理统计(第四版),浙江大学,2011。

[2] 袁志发宋世德,多元统计分析(第二版),科学出版社,2008。

[3] 李卫东,应用多元统计分析,北京大学出版社,2008.[4] 佟昕宋捷,谈统计学中的相关与回归分析,经济视野,1672—5646(201 1)05—0017—02。

[5] 中国统计年鉴,2009。

[6] 谢辉樊丁宇张雯郭春苗周晓明严鹏卢春生,统计方法在葡萄理化指标简化中的应用,新疆农业科技,1001-4330{2011}08143404。

[7] 姜启源谢金星叶俊,数学模型,北京:高等教育出版社,2003。

附录样品号一组二组样品号红葡萄酒白葡萄酒红葡萄酒白葡萄酒平均值X i样品方差X j样品方差Y i样品方差Y j样品方差X i-Y i X j-Y j1 62.79.63882.9.60368.19.04977.95.08714.1 -5.42 80.36.30874.214.18074.4.02875.87.0052-1.6 6.33 80.46.76979.219.10874.65.54275.611.93733.6 5.84 68.610.39479.46.68771.26.42676.96.48842.5 -2.65 73.37.87571.11.24572.13.69581.55.1265-10.5 1.26 72.27.72968.412.75666.34.59675.54.7676-7.1 5.97 71.510.17977.56.25865.37.91774.26.49473.3 6.28 72.36.63470.412.78266.8.06972.35.5798-1.9 6.39 81.55.74072.99.63278.25.07380.410.3099-7.5 3.310 74.25.51474.314.58368.86.01579.88.39010-5.5 5.411 73.8.41272.313.30961.66.16871.49.371110.9 11.412 53.98.92563.310.76168.35.01272.411.83412-9.1-14.413 74.66.70365.913.06868.83.91073.96.83913-8.0 5.814 73.6.00072.10.68772.64.81277.13.98514-5.1 0.415 58.79.25072.411.47265.76.43078.47.35115-6.0 -7.016 74.94.25474.13.34269.94.48367.39.068166.7 5.017 79.39.38178.812.00774.53.02880.36.20117-1.5 4.818 59.96.87173.112.51265.47.09076.75.49818-3.6 -5.519 78.66.88372.26.81272.67.42776.45.10319-4.2 6.020 79.23.93877.88.02575.86.25076.67.074201.2 3.421 77.110.77576.413.14272.25.95979.28.02521-2.8 4.922 77.27.11571.11.77671.64.92679.47.32122-8.4 5.623 85.65.70075.96.60777.14.97777.43.40623-1.5 8.524 78.8.65473.310.54171.53.27476.16.20824-2.8 6.525 69.28.03977.15.82068.26.61379.510.32025-2.4 1.026 73.85.59481.38.53872.6.44674.310.144267.0 1.827 73.7.05564.812.01771.54.52877.5.96327-12.2 1.528 81.38.97079.65.038281.7方差平均值平均值d2.67-2.525 7.420 10.937 5.634 7.140方差S5.5245.112。

相关主题