承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)和队外的任何人(包括指导教师)研究、讨论和赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。
如有违反竞赛规则的行为,我们将受到严肃处理。
我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。
我们参赛选择的题号是(从A/B/C/D中选择一项填写):我们的参赛报名号为(如果赛区设置报名号的话):所属学校(请填写完整的全名):参赛队员(打印并签名) :1.2.3.指导教师或指导教师组负责人(打印并签名):日期: 2012 年 9 月 10 日赛区评阅编号(由赛区组委会评阅前进行编号):编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):评阅人评分备注全国评阅编号(由全国组委会评阅前进行编号):葡萄酒的评价方法研究摘要在本文中,我们分析葡萄酒和酿酒葡萄的理化指标和所酿的葡萄酒的质量之间的关系,研究能否用葡萄和葡萄酒的理化指标评价葡萄酒的质量。
针对问题一,本文分析了所给附件1中两组评酒员对不同葡萄酒样品的评价结果,运用方差分析法来分析两组评价结果差异的显著性。
在显著性水平取为0.05的情况下,发现两组评价结果的均值和方差均满足齐性,即两组评酒员的评价结果没有显著性差异。
因无显著差异,本文把两组评酒员的评分的总均值作为葡萄酒评分的期望值,计算两组评酒员对于各酒样品评分的方差并求和,结果显示第二组的总方差明显小于第一组,即其评分稳定性更高,得出第二组的评价结果更可信。
针对问题二,本文借助问题一中第二组的评价结果,将葡萄酒的质量数量化。
运用主成分分析方法,得出酿酒葡萄的主要理化指标,在此基础上运用相关性分析法,分析了酿酒葡萄的主要理化指标和葡萄酒质量的相关程度,将酿酒葡萄的主要理化指标的加权平均值作为葡萄分级的标准,其中权重取为理化指标的相关系数。
把各葡萄样品的主要理化指标代入表达式,得到最终加权平均值,对其划分级别,并作为葡萄的级别。
结果显示红葡萄样品集中在第2,3,4级,而白葡萄大多数集中在第2级(级别数值越小代表葡萄质量越好)。
针对问题三,本文依据问题二中所得的酿酒葡萄的主要理化指标,运用相关性分析法,分析了葡萄酒的理化指标和酿酒葡萄的主要理化指标之间的相关程度,我们得到的主要结论为:红葡萄酒中的花色苷和酿酒葡萄中的DPPH自由基、褐变度显著相关,和酿酒葡萄的出汁率、槲皮素、柠檬酸低度相关,和酿酒葡萄的其他主要理化指标微弱相关;白葡萄酒中的单宁和酿酒葡萄的DPPH自由基、葡萄总黄酮、谷氨酸、异亮氨酸低度相关,和酿酒葡萄的其他主要理化指标微弱相关。
针对问题四,考虑到除葡萄和葡萄酒的理化指标外,葡萄和葡萄酒的芳香物质可能对葡萄质量也会造成影响。
首先,运用主成分分析法,得出芳香物质中的主要成分,并借助问题二中所得的酿酒葡萄的主要理化指标,运用相关性分析法,综合分析了葡萄酒质量受酿酒葡萄和葡萄酒的理化指标、酿酒葡萄和葡萄酒中的芳香物质的影响程度。
根据所得结果,取和葡萄酒质量关联程度较大的因素作为自变量,以葡萄酒质量作为因变量,运用多元线性回归模型建立相应的函数关系。
通过上述定性和定量分析,说明葡萄酒的质量受葡萄和葡萄酒中芳香物质的影响,因此不能仅以葡萄和葡萄酒的理化指标判别葡萄酒的质量。
以上结果具有较高的可靠性和可行性,对于葡萄酒的评价具有一定的指导意义。
关键词:葡萄酒质量理化指标方差分析主成分分析多元线性回归相关性分析一:问题重述葡萄酒质量的一般是通过一批有资质的评酒员的品评来确定的。
他们对葡萄酒进行品尝后对其分类指标打分,然后求和得到总分,从而确定其质量。
葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量,酿酒葡萄的好坏和所酿葡萄酒的质量有直接关系。
根据所给相关资料,建立数学模型讨论如下的问题:1:分析附件1中的两组评酒员的评价结果有无显著差异并分析哪组的结果更可靠。
2:根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。
3:分析酿酒葡萄和葡萄酒的理化指标之间的联系。
4:分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?二:模型假设1. 假设各评酒员进行评分时,公正客观的对各酒样品的进行评分。
2. 假设各评酒员对不同酒样品的评价结果服从正态分布。
3. 假设进行方差分析时,各评酒员对不同酒样品的评价结果互不干扰,相互独立。
4. 假设问题四中,除葡萄和葡萄酒的理化指标外,仅有芳香物质对葡萄酒的质量产生影响。
三:符号说明w SS …………………………随机误差 t SS …………………………总偏差平方和b SS ……………………………组间平方和 b df ……………………………组内自由度 i x ………………………………平均数 n ………………………………样本总数 α………………………………显著性水平 m ………………………………组数i F ………………………………第i 类主成分w MS b MS ……………………均方根12x x S -………………………………均数差异标准误差 21S 22S ……………………………样本方差ij a ………………………………主成分系数p ………………………………第p 个观测量A ………………………………主成分系数矩阵 R ………………………………相关系数矩阵ij x ……………………………第j 个评酒员对第i 种酒样品的评分0β,1β,…,p β…………………1+p 个未知参数 ε………………………………不可测随机误差 cov(,)x y ………………………,x y 的协方差 (),()D x D y ……………………,x y 的方差ρ………………………………相关系数i a ………………………………红葡萄酒质量相关的各因素的系数 i b ………………………………白葡萄酒质量相关的各因素的系数四:模型的建立和求解问题一:两组评酒员评价结果的差异分析——方差分析法针对问题一,本文首先查阅相关资料,给出关于显著性差异的解释:显著性差异是一个统计学名词,它是统计学上对数据差异性的评价。
当数据之间具有了显著性差异,就说明参和比对的数据是来自于具有差异的两个不同总体,对于显著性差异的检验通常采用方差分析法[1]。
根据附件1所给的葡萄酒品尝评分表,本文采用方差分析法来分析两组评价员评价结果的差异性。
方差分析是检验多组样本均值间的差异是否具有统计意义的一种方法[2],运用方差分析法各样本必须符合以下条件: (1)样本是相互独立的随机样本; (2)各样本来自正态总体;方差分析认为不同处理组的均值间的差别基本来源有两个:(1)随机误差,如测量误差造成的差异或个体间的差异,称为组内差异,用变量在各组的均值和该组内变量值之偏差平方和的总和表示, 记作w SS ,组内自由度w df (2)实验条件,即不同的处理造成的差异,称为组间差异。
用变量在各组的均值和总均值之偏差平方和表示,记作b SS ,组间自由度b df (3)总偏差平方和t SS 的公式2..11()knt ij i j SS x x ===-∑∑221111(..)(...)(.)k nk niji ij i i j i j xx x x x x ====⎡⎤-=-+-⎣⎦∑∑∑∑2211(...)2(...)(.)(.)k n i i ij i ij i i j x x x x x x x x ==⎡⎤=-+--+-⎣⎦∑∑2211111(...)2[(...)(.)](.)k k n k ni i ij i ij i i i j i j n x x x x x x x x ======-+--+-∑∑∑∑∑其中.1()0niji j xx =-=∑所以222 (11)111()()()k nk k niji ij i i j i i j xx n x x x x =====-=-+-∑∑∑∑∑上式中,21(...)ki i n x x =-∑为各处理平均数.i x 和总平均数..x 的离均差平方和和重复数n 的乘积,反映了重复n 次的组间变异,称为组间平方和,记为b SS ,即21(...)kb i i SS n x x ==-∑上式中,2.11()k nij i i j x x ==-∑∑为各组内均差平方和之和,反映了各组内的变异即误差,称为组内平方和或误差平方和,记为w SS ,即2.11()knw ij i i j SS x x ===-∑∑于是有t b w SS SS SS =+这个关系式中三种平方和的简便计算公式如下:2112.11knt ij i j k b i i SS x CSS x C n ====-=-∑∑∑w t b SS SS SS =+组内w SS 、组间b SS 除以各自的自由度(组内w df n m =-,组间1b df m =-,其中n 为样本总数,m 为组数),得到其均方w MS 和b MS ,一种情况是处理没有作用,即各组样本均来自同一总体,1b w MS MS ≈。
另一种情况是处理确实有作用,那么, b w MS MS (远远大于)。
b w MS MS 构成F 分布,用F 值和其临界值比较,推断各样本是否来自相同的总体。
(4)方差分析的假设检验:零假设0H :m 组样本均值都相同,即12m μμμ===,如果经过计算结果组间均方远远大于组内均方(b w MS MS ),0.05(,)b w df df F F >,0.05α<,拒绝零假设, 说明样本来自不同的正态总体,说明处理造成均值的显著差异;否则0.05(,)b w df df F F <,0.05α>,不能拒绝零假设,说明样本来自相同的正态总体,处理间无差异。
其中α为显著性水平。
本文对于不同的酒样本方差检验结果如下:红葡萄酒 样品1 2 3 4 5 6 7 8 9 α 0.314 0.100 1.00 0.684 0.613 0.793 0.335 0.632 0.178 红葡萄酒 样品101112 13 14 15 16 17 18 α 0.300 0.423 0.391 0.852 0.558 0.320 1.00 0.079 0.381 红葡 萄酒 样品192021222324252627α 1.00 0.037 0.768 0.257 0.569 0.927 0.788 0.092 0.678表2 白葡萄酒各样品的方差分析结果白葡 萄酒 样品12345678910α 0.990 0.392 0.188 0.817 0.949 0.832 0.299 0.054 0.952 0.979白葡 萄酒 样品11 12 13 14 15 16 17 18 19 20α 0.510 0.325 0.737 0.270 0.304 0.601 0.200 0.082 0.673 0.432白葡 萄酒 样品21 22 23 24 25 26 27 28α 0.943 0.459 0.620 0.462 0.136 0.540 0.896 0.881在显著性水平0.05α>的情况下,两组评酒员的评分结果无显著差异;在显著性水平00.05α<<的情况下,两组评酒员的评分结果存在显著性差异。