学号:2009043022TONGREN UNIVERSITY本科毕业论文浅谈回归分析在葡萄酒等级评估的应用何继铭系别:数学与计算机科学系学科:理学专业:数学与应用数学专业指导教师:夏林丽贵州●铜仁2013年06月Tongren university数学与应用数学专业本科毕业论文贵州●铜仁2013年06月目录(理科)1。
引言ﻩ错误!未定义书签。
2.问题描述............................. 错误!未定义书签。
3.问题分析ﻩ错误!未定义书签。
4。
模型的建立与求解.................... 错误!未定义书签。
4。
1建立模型ﻩ错误!未定义书签。
4。
2 模型求解........................ 错误!未定义书签。
5.小结.............................. 错误!未定义书签。
6.参考文献.............................. 错误!未定义书签。
7.感谢信ﻩ错误!未定义书签。
浅谈回归分析在葡萄酒等级评估的应用数学与计算机科学系数学与应用数学专业何继铭摘要葡萄酒和酿酒葡萄检测的理化指标在一定程度上反应葡萄酒和葡萄的质量,针对这类问题,通过分析酿酒葡萄和葡萄酒成分之间关系的原理及对所给样本数据进行分析和处理,建立相应的回归模型,进而得到酿酒葡萄的好坏直接影响葡萄酒的等级的结论。
关键词:葡萄酒回归分析理化指标Discussion on the application of regression analysis in Wine Assessment Mathematics and Computer ScienceDepartment Mathematics and Applied MathematicsHe JimingABSTRACTP hysical and chemical indicators of wine and wine grape detection reaction toa certain extent the qualityof wine and grapes, for such problems byanalyzing the principle of the relationship between wine grape and wine compositio nto the sample data analysis and processing, to establish the appropriateregression model, and then get the wine grapes direct impact onthe level of the conclusions of thewine。
Keywords:model wine regression analysisphysicochemical index1引言目前我国生产的葡萄酒在酒的总产量中比例相当低,占全国酒总产量的1%,其中占啤酒产量的1.25%、白酒产量的6.67%,黄酒产量的20%。
所以发展空间相当大[1]。
另外,从行业的生命周期角度看,我国葡萄酒产业现处于孕育期向成长期过度阶段,随着生活方式逐步西化和收入水平的提高,人们的生活品质越来越高,葡萄酒逐步成为衡量生活水平高低的一种途径。
因此,葡萄酒的质量尤为重要,而酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄的理化指标也会在一定程度上反映葡萄酒和葡萄的质量。
基于此,本文探讨葡萄酒的理化指标与葡萄的理化指标之间的联系具有一定的理论意义和现实价值。
2问题描述葡萄酒的质量一般是通过一些有资质的评酒员来进行品评。
每个评酒员在对葡萄酒进行品尝后对其各个分类指标打分,然后求和得到葡萄酒的总分,从而来确定葡萄酒的质量。
酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄的理化指标也会在一定程度上反映葡萄酒和葡萄的质量。
通过附件1给出某一年份一些葡萄酒的评价结果,附件2和附件3分别给出该年份这些葡萄酒的和酿酒葡萄的成分数据,分析酿酒葡萄与葡萄酒的成分之间关系的原理,探讨葡萄酒的理化指标与葡萄的理化指标之间的联系.3问题分析根据附表2中知酿酒葡萄理化指标中含的成分[2]有氨基酸、蛋白质、VC、花色苷、酒石酸、苹果酸、柠檬酸、多酚氧化酶、褐变度、总酚、单宁、葡萄总黄酮白藜芦醇、反式白藜芦醇苷、顺式白藜芦醇苷、反式白藜芦醇、顺式白藜芦醇、黄酮醇、杨梅黄酮、槲皮素、山萘酚、异鼠李素、总糖、还原糖、果糖、葡萄糖、可溶性固形物、PH值、可滴定酸、固酸比、干物质含量、果穗质量、百粒质量、果梗比、出汁率、果皮质量、果皮颜色.而葡萄酒理化指标中含的成分有花色苷、单宁、总酚、酒总黄酮、白藜芦醇、反式白藜芦醇苷、顺式白藜芦醇苷、反式白藜芦醇、顺式白藜芦醇、DPPH半抑制体积、色泽。
比较酿酒葡萄和葡萄酒的成分得知酿酒葡萄的理化指标与葡萄酒的理化指标有共同之处,也有不同之处,它们的共同之处就是都含有以下几种理化指标:DPPH半抑制体积(IV50) 花色苷、总酚、单宁、葡萄总黄酮、白藜芦醇、反式白藜芦醇苷、顺式白藜芦醇苷、反式白藜芦醇、顺式白藜芦醇。
观察它们相同成分的数据得知一级指标(DPPH 半抑制体积、总酚、单宁、葡萄总黄酮、白藜芦醇)之间存在某种关系。
除DPPH 半抑制体积(IV50)、单宁(mol/L)、总酚(mol/L)、酒总黄酮(mol/L)、白藜芦醇(mg/L)几种影响葡萄酒质量较大外,花色苷、反式白藜芦醇苷,顺式白藜芦醇苷,反式白藜芦醇对葡萄酒影响不大,所以其数据可忽略。
针对以上DP PH半抑制体积(IV50)、单宁(mol/L)、总酚(mol/L)、酒总黄酮(mol/L)、白藜芦醇(mg/L)几种理化指标,用最小二乘法拟合来显示出酿酒葡萄与葡萄酒理化指标之间的联系[3]。
想到联系就自然想到了相关性,解决这个问题就利用相关系数进行变量间线性关系的分析,考虑到样本数据太多,首先用主成分分析法提取出葡萄酒的理化指标的主成分,进行选择数据中共同数据相关一级理化指标,可以求出酿酒葡萄理化指标的各个主成分(即一级理化指标)与葡萄酒的各个理化指标之间的关系。
再通过回归分析,用最小二乘法得到酿酒葡萄的理化指标和葡萄酒理化指标的一元回归方程[5],从而得到酿酒葡萄的理化指标和葡萄酒的理化指标线性相关[8]。
4模型的建立与求解4.1建立模型对附件2所给数据进行分析,得出酿酒葡萄的一级理化指标与葡萄酒的一级理化指标之间存在联系。
进而,通过回归分析,建立酿酒葡萄的理化指标和葡萄酒理化指标的一元回归方程模型[4]:=+(1)y a bx4.2 模型求解最小二乘法是估计未知参数的一种重要方法,本文采用此种方法估计(1)式的未知参数a 和b 。
4.2。
1 红酿酒葡萄和红葡萄酒理化指标的一元回归方程 设误差的平方和[5][]2112)(),a (∑∑==+-==ni iini i x y b a b Q ε (2)由于a 、b不能确定,需要估计,所以设a ∧、b ∧为其估计量.根据微分的极值原理,将),(b a Q 分别对a ,b 求偏导,并令他们等于零,得到方程组:()()⎪⎪⎩⎪⎪⎨⎧=---=∂∂=---=∂∂∑∑==ni i i i ni i i x x y x y b a b Q b a a Q11202 (3)由(3)式则有估计量a ∧,b ∧可表示为:∑∑=-=--∧⎪⎭⎫ ⎝⎛-⎪⎭⎫ ⎝⎛-⎪⎭⎫ ⎝⎛-=ni i ni i i x y x x y x b 121 (4)-∧-∧+=xb y a(5)求出估计量a ∧,b ∧得到的一元回归方程为b x a ˆˆy +=其中-x 表示酿酒葡萄几个理化指标的平均值,-y 表示葡萄酒几个理化指标的平均值.)5,4,3,2,1(=i x i分别表示附表中酿酒葡萄的DPP H半抑制体积(IV50)、单宁、总酚、总黄酮、白藜芦醇的平均值,5,4,3,2,1i=y 分别表示附表中葡萄酒DPPH 半抑制体积(IV 50)、单宁、总酚、总黄酮、白藜芦醇的平均值,n 表示理化指标的个数。
从附件2表格分别取出酿酒葡萄、葡萄酒的一级理化指标(即DPPH 半抑制体积(IV 50)、单宁、总酚、总黄酮、白藜芦醇),并对附表中所取的各理化指标进行分析求平均值。
酿酒红葡萄、红葡萄酒一级理化指标的平值及一元回归方程用到的相关数据如下表所示:表1 数据表将上表数据代入(4)式、(5)式得:432.0121=⎪⎭⎫⎝⎛-⎪⎭⎫ ⎝⎛-⎪⎭⎫ ⎝⎛-=∑∑=-=--∧ni ini i i x y x x y x b831.0a =+=-∧-∧x b y得出线性回归方程:x 831.0432.0y +=即酿酒红葡萄与红葡萄酒的理化指标线性相关。
4。
2。
2 求白酿酒葡萄和白葡萄酒理化指标的一元回归方程同4。
2.1中的方法步骤从附件2表格取出酿酒葡萄与葡萄酒相同的一级指标的理化指标(即DPP H半抑制体积(IV50)、单宁、总酚、总黄酮、白藜芦醇),白葡萄、白葡萄酒各一级理化指标的平均值及一元回归方程用到的相关数据如下表所示:表2 数据表将上表数据代入(4)式、(5)式得[6]:217.0121=⎪⎭⎫⎝⎛-⎪⎭⎫⎝⎛-⎪⎭⎫ ⎝⎛-=∑∑=-=--∧ni ini ii x y x x y x b349.0.0a =+=-∧-∧x b y线性回归方程为x 349.0217.0y +=即为酿酒白葡萄与葡萄酒之间的理化指标之间线性相关。
5 小结通过对附表2中数据给定理化指标的数据求得酿酒葡萄对葡萄酒的好坏为正增长影响,酿酒葡萄选择越好酿造的葡萄酒等级越高。
由于本文在收集数据时只考虑了酿酒葡萄和葡萄酒几个共同的一级指标,所以在计算它们相关性是存在误差,但并没有对误差进行检验,故存在不足,还需进一步深入研究。
6 参考文献[1] 沈宇辉.葡萄酒鉴(第一版).金城出版社.2008。
[2] 刘保东,关家锐,冯素萍,王淑仁,聂伟。
葡萄酒原汁含量的多元回归分析[J ].山东大学学报(理科版).1998,(2)。
[3]韩旭里,谢永钦.概率论与数理统计[修订版].上海市国权路579号。
复旦大学出版社.2009.[4]姜启源,谢金星,叶俊.数学建模[第三版] .北京市西城区德外大街4号.高等教育出版社.2003.[5] 张雄,李得虎。
数学方法论与解题研究。
北京市西城区德外大街4号.高等教育出版社。
2003。
[6]封建湖、车明刚.计算方法典型题分析解集[M].西北工业大学出版社,2003.7感谢信本设计的完成是在我们的导师班主任夏林丽老师的细心指导下进行的。