当前位置:文档之家› 葡萄酒的质量评估

葡萄酒的质量评估


二、 符号说明
x y
葡萄花色苷 葡萄酒花色苷
三、 模型假设
假设所得数据真实有效; 假设没有检测到的物质含量很少,可忽略不计 假设题目所给每一种葡萄酒样品对应一种葡萄,不存在多种葡萄混合酿酒的情况。
四、 建模过程
问题一:求出各个样品两组各自 10 名评酒员的评分之和,再求均值。得出下表: 红葡萄酒 第一组平均分 第二组平均分 62.7 68.1 80.3 74 80.4 74.6 68.6 71.2 73.3 72.1 72.2 66.3 71.5 65.3 72.3 66 81.5 78.2 74.2 68.8 70.1 61.6 53.9 68.3 74.6 68.8 73 72.6 58.7 65.7 74.9 69.9 79.3 74.5 59.9 65.4 78.6 72.6 78.6 75.8 77.1 72.2 77.2 71.6 85.6 77.1 78 71.5 69.2 68.2 73.8 72 73 71.5 采用单因素分析,
72.9 72.3 63.3 65.9 72 72.4 78.8 73.1 72.2 77.8 76.4 71 75.9 73.3 77.1 81.3 64.8 81.3 采用单因素分析,Matlab 软件作图如下:
80.4 71.4 72.4 73.9 77.1 78.4 80.3 76.7 76.4 76.6 79.2 79.4 77.4 76.1 79.5 74.3 77 79.6
葡萄酒的质量评估 摘要
确定葡萄酒质量时一般是通过聘请评酒员进行品评, 通过对葡萄酒的各类指标进行 评分求和,进而确定葡萄酒的质量。本题通过建立相关的数学模型,确定酿酒葡萄、葡 萄酒各项理化指标和葡萄酒质量的关系。 针对问题一, 首先采用单因素分析法, 比较两组评酒员的评价结果有无显著性差异, 经过计算发现存在显著性差异。抽取几个样品,分别对两组的评酒员的评价结果采用双 因素分析法,最后得出哪一组评酒员更可信。 针对问题二,采用聚类分析法,对酿酒葡萄的多个理化指标进行聚类分析,由第一 问可知第二组评酒员较可信,所以采用附件 1 中第二组评酒员的评分,根据 27 种葡萄 酒样品的得分情况,按《葡萄酒观察家》的评分体系,将红葡萄酒分为 2 档,白葡萄酒 分为 3 档[1],则该种葡萄酒所采用的葡萄就处于相应的等级。 针对问题三,采用多元回归分析,以葡萄酒的各项理化指标为因变量,酿酒葡萄的 各项指标为自变量,运用 Matlab 软件求解相关函数关系式。 针对问题四,由相关资料可知[2],影响葡萄酒的感官评估的因素主要是芳香物质, 根据附件 3,我们可以求和计算总的芳香物质的量,结合附件 2 的理化指标进行聚类分 析,结合附件 1 第二组评酒员的评价结果,进行分级,与问题二的结果比较分析得到葡 萄与葡萄酒的理化指标和葡萄酒质量的联系。. 关键词:单因素分析、双因素分析、聚类分析、相关性分析
问题重述
1. 分析附件 1 中两组评酒员的评价结果有无显著性差异,哪一组结果更可信? 2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。 4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄 酒的理化指标来评价葡萄酒的质量? 一、 问题分析 问题一:分别对两组评酒员对葡萄酒的评分求和、求均值,最终得到两组评酒员对每一 种葡萄酒样品的平均评分。采用 Matlab 软件对两组评酒员对同一种葡萄酒样品的评分 进行单因素分析,分析得到二者的结果的差异是否显著。若差异显著,再随机抽取几个 样品,对两组评酒员的评价结果进行双因素分析,根据差异性是否显著可以确定哪一组 评酒员的结果更可信。 问题二:由问题一可知差异性小的一组评酒员是哪一组,以该组的评分为葡萄酒样品的 质量评分。对酿酒葡萄的多个指标采用聚类分析,利用 Matlab 软件作图,结合《葡萄 酒观察家》对葡萄酒的评分分档,认为处于某一档次的葡萄酒所采用的葡萄原料也处于 同一级别,从而对葡萄进行分级。 问题三:酿酒葡萄与葡萄酒理化指标的关系应采用相关性分析里的多元回归分析,参考 相关资料[3],利用 Matlab 软件进行求解。 问题四:采用聚类分析得到葡萄酒根据葡萄酒理化指标所分的类别,结合问题二得到的 酿酒葡萄的分级情况,可知酿酒葡萄与葡萄酒的理化指标与葡萄酒质量是否有关。
白葡萄酒 样品 1 样品 2 样品 4 样品 5 样品 6 样品 7 样品 8 样品 9 样品 11 样品 12 样品 13 样品 14 样品 15 样品 17 样品 18 样品 19 样品 20 样品 21 样品 22 样品 23 样品 24 样品 25 样品 26 样品 27 样品 28
第一组标准差 第二组标准差 9.603240194 5.087020521 14.17979784 7.004760286 6.686636756 6.488451279 11.24475186 5.1261855 12.75582656 4.766783215 6.258327785 6.494442068 13.54990775 5.578729445 9.631545393 10.30857248 13.3087273 9.371351142 10.76052456 11.83403754 13.06777206 6.838615844 10.68747969 3.984692934 11.47170432 7.351492668 12.00740512 6.201254353 12.51177223 5.49848464 6.811754546 5.103375789 8.024961059 7.074209811 13.14195994 8.024961059 11.77568116 7.321202087 6.607235092 3.405877273 10.54145257 6.208417225 5.82046199 10.31988372 8.538149682 10.14396372 12.01665511 5.96284794 8.969702088 5.03763613
因为 p=0.2657>0.05,所以两组白葡萄酒评分没有显著性差异。 为了进一步分析两组结果的可信度,我们采用计算标准差的方法来比较。 两组评酒员对红葡萄酒和白葡萄酒样品平均评分的平均标准差如下表: 红葡萄酒 第一组标准差 第二组标准差 样品 1 9.638464608 9.048634028 样品 2 6.307843442 4.027681991 样品 3 6.769211344 5.541760651 样品 4 10.39444296 6.425643072 样品 5 7.874713399 3.695342414 样品 6 7.728734265 4.595891885 样品 7 10.17895432 7.91692982 样品 8 6.634087059 8.069145625 样品 9 5.739725119 5.072803301 样品 10 5.513619501 6.01479657 样品 11 8.412292593 6.16801787 样品 12 8.92499611 5.01220732 样品 13 6.703233051 3.91010088 样品 14 6 4.812021982 样品 15 9.250225222 6.429964576 样品 16 4.254409477 4.483302354 样品 17 9.381423725 3.027650354 样品 18 6.87103421 7.089898918 样品 19 6.883151733 7.426678636 样品 20 5.103375789 6.250333324
P 值均小于 0.05,说明两组样品存在显著性差异,而且某组评酒员之间的评价也存在显 著性差异。 样品 11 通过软件计算出 P 值,P=0.0003<0.01 说明两组样品评价存在非常显著性差异, 而另一个 P=0.1978>0.05,说明每个组各个评酒员间对于样品 11 的评价差异不大。
所以,对于红葡萄酒而言,第二组评酒员的结果更可信。 对于白葡萄酒可以采用相同的分析方法, 白葡萄酒: 第一组平均值 第二组平均值 82 77.9 74.2 75.8 79.4 76.9 71 81.5 68.4 75.5 77.5 74.2 71.4 72.3
6
7
8
9
10
84 73 71 6
72 75 70 7
59 68 66 8
84 76 90 9
84 75 73 10
70 66 66
50 66 64
57 72 51
74 65 67
72 72 64
对于样品 7,p = 0.0892 0.1364 均大于 0.05 所没有显著性差异 样品 10,通过 matlab 编程计算得
得到 P=0.0017<0.01 说明两组评酒员的评价结果存在显著性差异 采用双因素分析,得出下图,
抽取红葡萄酒中的 7、10、11 号样品 第一 1 2 3 4 5 组评 酒员 7 63 70 76 64 59 10 67 82 83 68 75 11 73 60 72 63 63 第二 1 2 3 4 5 组评 酒员 7 68 65 68 65 47 10 67 73 82 62 63 11 64 61 67 62 50
平均标准差: 10.39893731 6.821489947 通过比较最后的平均标准差,得出第一组红、白葡萄酒评分的标准差比较大,说明第二 组评价比较准确。分体系和分级标准, ,起评分为 50 分, 共分为 6 个档次。[1]
95-100 分:经典绝佳之作。 90-94 分:卓越出众,极具个性与风格。 85-89 分:优秀,且具特点。 80-84 分:优良,酿制工艺不错。 75-79 分:普通的,有些微的缺点,但依旧可以饮用。 50-74 分:不推荐的。 由第一问可知, 第二组评酒员的评价结果更可信, 所以我们采用第二组的评价结果将红、 白葡萄酒样品进行分类,分类如下: 红葡萄酒: (1)50-74 分有:样品 25、27、7、10、11、1、16、18、12、15、16、19、14、6、4、 5、2、21、24、22、8、13、其中样品 11 评分最低为次品,样品 2 评分较高。 (2)75-79 分:23、3、17、20、9 其中样品 17 评分最低,样品 9 评分最高为较优品。 白葡萄酒: (1) 80-84 分:样品 5、9、17、28、25 其中最高为 5 最低分是 25 (2)75-79 分:样品 6、2、24、19、20、18、4、27、14、23、1、15、21、22,最高 为 22,最低为 6 (3)50-74 分:样品 11、8、12、13、7、26,最高为 26,最低为 11 根据酿酒葡萄的理化指标[2] 糖、酸、单宁、色素和芳香物质是构成酿酒葡萄品质优劣 的要素。影响葡萄酒品质的因素除酿造技术外,葡萄果中的五大要素物质的含量及构成 比例起着非常重要的作用。可以说葡萄果中的糖、酸、单宁、芳香物质和色素是判断酿 酒葡萄品质的指标性。所以,我们采用聚类分析方法对该问题进行探究。 红葡萄酒: (1) 对附件 2 葡萄理化指标数据进行处理,测量三次的都取其平均值。 (2) 用 matlab 进行聚类分析如下图,再根据前面对葡萄酒的质量分类综合来对葡萄 进行分类。
相关主题