当前位置:文档之家› 葡萄酒质量的综合评价分析模型

葡萄酒质量的综合评价分析模型

葡萄酒质量的综合评价分析模型专家点评:本文问题一方法合理,结论正确。

问题二对葡萄理化指标进行聚类,然后根据葡萄酒质量进行分级,思路简明正确。

问题三进行多元线性回归,尚可,但如果能进行相关性分析会更好。

问题四用逐步回归的方法,适当,加入芳香类物质,使结论更加合理。

如果问题二和问题三也能将附件三考虑入内会使结论更加有力。

【摘要】近年来,我国掀起了一场葡萄酒热,对葡萄酒的需求与日俱增,特别是随着食品科学技术的发展,人们不再满足传统感官评价葡萄酒的水平,如何运用数据资料定量研究葡萄酒的品质,加快建立葡萄酒市场指标规则成为人们关注的焦点。

本文主要研究了葡萄酒的品质与葡萄酒自身以及酿酒葡萄的理化指标的关系,给出了基于葡萄酒自身的理化指标以及酿酒葡萄的理化指标与芳香物质的定量综合评价模型。

首先基于两组评酒员对同一批葡萄酒的评价分数数据,采用假设检验中的t检验法建立评估两组数据差异的模型,得到了两组评酒员的评分存在显著差异的结论,并通过对两组数据进行方差分析,以判别结果具有的稳定性作为标准,得到第二组比较可靠。

接下来我们结合酿酒葡萄的理化指标和可信组评酒员的打分所刻画的葡萄酒的质量对酿酒葡萄进行分级,用聚类分析的方法将红,白葡萄酒和酿酒葡萄各分成了5类,然后对分好的葡萄类所酿造的葡萄酒进行统计,得到各类葡萄所对应的级别。

更进一步,我们分析了酿酒葡萄和葡萄酒的理化指标之间的联系,运用主成分分析的方法,从酿酒葡萄的30个指标中提取出了12个主要成分,进而通过逐步回归的方法建立起酿酒葡萄和葡萄酒的理化指标联系的模型。

最后我们将提取葡萄及葡萄酒的理化指标与芳香物质中的主成分,利用逐步回归的方法考察理化指标与芳香物质对葡萄酒质量的影响程度,通过对芳香物质对葡萄酒质量影响比重得到芳香物质对葡萄酒的质量有30%以上的影响比重(白葡萄的芳香物质对白葡萄酒的质量影响相对更大),故而不能完全用酿酒葡萄和葡萄酒的理化指标评价葡萄酒的质量。

关键词:假设检验聚类分析主成分分析逐步回归一、问题重述1.1问题背景葡萄酒是由新鲜葡萄或葡萄汁经过酒精发酵而得到的一种含酒精饮料。

葡萄酒质量是其外观、香气、口感、整体的综合表现。

一方面,酒中的糖、酸、矿物质和酚类化合物,都具有各自独特的风味,它们组成了葡萄酒的酒体;另一方面,酒中大量的挥发性物质,包括醇、脂、醛、碳氢化合物等,都具有不同浓度、不同愉悦程度的香气,葡萄酒最终的质量则是葡萄酒中各种成分协调平衡的结果。

1.2问题提出随着葡萄酒产业逐渐升温,为了获得质量更好的葡萄酒,对酿酒葡萄及葡萄酒的研究也越加深入。

现在流行的做法是通过聘请一批有资质的评酒员进行品评,但是这种感官评价的主观性总是带给我们模糊的印象。

正如我们所知的,酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。

如何充分利用这些理化指标定量研究葡萄酒的质量成了炙手可热的研究问题。

二、问题分析题目为我们提供了感官评价指标,葡萄和葡萄酒的各种理化指标和芳香物质的信息。

本文的关键就是通过分析处理已给的数据,建立数学模型来研究葡萄酒质量的确立。

为此,我们要依次达到题目给出的以下几个目标:2.1 两组评价结果差异性和可信性研究问题一给出了两组评酒员对同一批葡萄酒的评价分数,本文采用假设检验中的t检验法建立评估两组数据差异的模型,研究两组评价员的评价结果是否存在差异,判断是否能接受它们有显著性差异的假设。

若判断的结果是这两组数据存在差异,我们就进入第二步,可靠性研究。

我们分别对两组数据求方差,方差小的那组说明波动比较小,评酒员的评定比较稳定,数据比较可靠。

2.2酿酒葡萄的分级首先,我们我们利用第一题的结果,用置信区间法对可信组的原始数据进行处理,降低评酒员之间的差异,提高酒样品之间的差异【1】;利用处理后的数据(总分)对葡萄酒进行分级;然后,用初步处理后的酿酒葡萄的理化指标对葡萄进行聚类分析,将葡萄分成了若干类;分析每类葡萄对应的葡萄酒大都属于哪一级别,从而得出葡萄的级别;最后,分析每一级葡萄理化指标的特点,建立起葡萄指标识别葡萄级别的模型帮助果农更好地利用好葡萄酿好酒。

2.3酿酒葡萄与葡萄酒理化指标的联系问题三要求研究葡萄与葡萄酒理化指标之间的联系,我们先对于葡萄的30个理化指标进行主成分分析法,得到葡萄一些具有代表性的理化指标。

然后我们建立葡萄的理化指标与葡萄酒的7个理化指标之间的多元线性回归方程,得到了酿酒葡萄与葡萄酒理化指标之间的定量联系。

2.4 理化指标对葡萄酒质量的影响及论证问题四要求研究酿酒葡萄与葡萄酒的理化指标对葡萄酒质量的影响,以及是否能完全用酿酒葡萄和葡萄酒的理化指标评价葡萄酒的质量。

我们将提取葡萄及葡萄酒的理化指标与芳香物质中的主成分,利用逐步回归的方法考察理化指标与芳香物质对葡萄酒质量的影响程度,通过对芳香物质对葡萄酒质量影响比重得到芳香物质对葡萄酒的质量有30%以上的影响比重(白葡萄的芳香物质对白葡萄酒的质量影响相对更大),故而不能完全用酿酒葡萄和葡萄酒的理化指标评价葡萄酒的质量。

三、问题假设1、同种葡萄酒在一组评酒员下的得分成正态分布。

2、一种葡萄对应酿制一种葡萄酒。

3、葡萄的成分充分转换成葡萄酒里的成分,不存在意外的浪费和挥发。

4、假设葡萄和葡萄酒芳香物质中没有检测到的成分不存在于该样本中,数据处理前将其置为零。

四、符号说明五、建模的建立与求解5.1模型一:基于t 检验建立差异评估模型我们采用假设性检验验证是否能接受两组评酒员评价结果无差异的假设。

然后用方差分析两组评酒员组内数据的波动,认为较平稳的一组数据比较可靠。

5.1.1数据预处理我们在整理数据的时候发现几个比较显著的异常数据:1)第一组红酒数据—样品20—色调—品酒员4号 数据缺失;2)第一组白酒数据—样品3—持久性—品酒员7号 数据明显有问题,怀疑是多敲了一个7;3)第一组白酒数据—样品8—口感分析—浓度—品酒员2号 数据明显异常。

因为随机样本在均值附近振荡,所以我们选用均值来代替异常数据以求误差最小。

5.1.2基于成对数据的t 检验【2】1)模型的建立:将两组评酒员分别看作两个整体1T 、2T ,对每个红葡萄酒样品(1)i J (1,2,,27)i = (白葡萄酒样品(2)i J (1,2,,28)i = )进行感官评价,1T 对每个红葡萄酒样品(1)i J 的评价结果通过组内每一位品酒员的评分(1)ijx (1,2,,10)j = 的均值10(1)(1)1110iij j x x ==∑来刻画,同样2T 对每个红葡萄酒样品(1)i J 的评价结果用均值10(1)1110i ij j y y ==∑来刻画,从而得到两组评酒员对每种样品酒的评价结果,建立两组评酒员对红葡萄酒的评价结果见表1。

红葡萄酒样品1234567891011121314第一组评分62.780.380.468.673.372.271.572.381.574.270.153.974.673第二组评分68.17474.671.272.166.365.36678.268.861.668.368.872.6D-5.46.3 5.8-2.6 1.2 5.9 6.2 6.3 3.3 5.48.5-14.4 5.80.4红葡萄酒样品15161718192021222324252627第一组评分58.774.979.359.978.678.677.177.285.67869.273.873第二组评分65.769.974.565.472.675.872.271.677.171.568.27271.5D-754.8-5.562.84.95.68.56.511.81.5表1 红葡萄酒的评价结果表中的数据是成对的,即对同一酒样品(1)i J 得到一对数据。

可知一对与另一对数据之间差异是由各种因素,如葡萄酒的外观、香气、口感、材料成分等因素引起的。

由于各酒样品(1)i J (1,2,,27)i = 的特性有广泛的差异,就不能将第一组评酒员1T 对27种红葡萄酒的评价结果看成是同分布随机变量的观测值。

因而表中第一行不能看成是一个样本的样本值,同样第二组的数据也不能看成是同一个样本的样本值,而同一对中两个数据是同分布随机变量的观测值,他们的差异是由于两组品酒员的水平引起的。

为鉴定他们的评价结果有无显著性差异,可使用基于成对数据的逐对比较法。

以红葡萄样品为例,有27对相互独立的评价结果:11222727(,),(,),,(,)X Y X Y X Y ,令111222272727,,,D X Y D X Y D X Y =-=-=- ,则1227,,,D D D 相互独立。

由于122,,,D D D 是由同一因素所引起的,可认为它们服从同一分布。

现假设2(,)i D D D N μσ ,1,2,,27i = 。

就是说1227,,,D D D 构成正态总体2(,)D D N μσ的一个样本,其中2,D Dμσ未知。

基于这一样本检验假设:01:0,:0D D H H μμ=≠ (1)分别记1227,,,D D D 的样本均值和样本方差的观测值为d ,2D s 。

对1227,,,D D D 进行单个均值的t 检验,检验问题的拒绝域为(显著水平为α):2(1)t t n α=≥-. (2)当t 的值不落在拒绝域内,接受0H ,认为两组品酒员的评价结果没有显著差异,否则两组品酒员的评价结果有显著性差异。

对白葡萄酒的处理同红葡萄。

2)模型的求解:现以红葡萄酒为例求解,首先,作出同一酒样品(1)i J (1,2,,27)i = 分别由两组品酒员1T 、2T 得到的评价结果之差,列于表1的第三行。

根据建立的模型需检验假设01:0,:0D D H H μμ=≠.我们取α=0.02,则20.01(26)(26) 2.4786t t α==,通过查表即知拒绝域为2.4786t =≥由观测值得 2.5407d =,227.7883D s =, 2.5044 2.4786t ==≥.现t 的值落在拒绝域内,故接受1H ;同样对白葡萄酒进行成对数据的t 检验,得白葡萄酒观测值之差的均值 2.5214d =-,224.9124D s =, 2.6249 2.4727t ==≥,故认为两组品酒员的评价结果有显著性差异。

5.1.3可信度定量分析1)模型的建立:记第一组10位品酒员对红葡萄酒样品(1)i J (1,2,,2i = 的评分为(1)ij a (1,2,,1j = ,10(1)(1)1110iij j a a ==∑,10(1)(1)2(1)2111()10i ij i j s a a ==-∑ (3) 其中,(1)i a 表示第一组品酒员对红葡萄酒样品(1)i J 的评分均值,(1)21i s 表示(1)i J 的评分方差;同样,第二组对红葡萄酒样品(1)i J 的评分均值和方差分别为10(1)(1)1110i ij j c c ==∑,10(1)(1)2(1)2211()10i ij i j s c c ==-∑ (4)从而对每一组品酒员得到一个评分方差向量(1)2(1)2(1)2(1)211112127(,,,)S s s s =(1)2(1)2(1)2(1)222122227(,,,)S s s s =同理可求得白葡萄酒的(2)21S ,(2)22S 。

相关主题