当前位置:文档之家› 主成分法及其应用

主成分法及其应用

【作者简介】苏键(1985-),男,广西钦州人,助理工程师,研究方向:食品科学。

1主成分分析法何谓主成分分析,就是将多个变量通过线性变换以选出较少个数重要变量的一种多元统计分析方法,又称主分量分析[1]。

主成分分析的中心思想是缩减一个包括很多相互联系着的变量的数量集,在数量集中保留尽可能多的有用的变量。

主成分分析的原理是设法将原来变量重新组合成一组新的相互无关的几个综合变量,同时根据实际需要从中可以取出几个较少的总和变量尽可能多地反映原来变量的信息的统计方法叫做主成分分析或称主分量分析,也是数学上处理降维的一种方法。

主成分分析是设法将原来众多具有一定相关性(比如P 个指标),重新组合成一组新的互相无关的综合指标来代替原来的指标。

通常数学上的处理就是将原来P 个指标作线性组合,作为新的综合指标。

最经典的做法就是用F1(选取的第一个线性组合,即第一个综合指标)的方差来表达,即Var (F1)越大,表示F1包含的信息越多。

因此在所有的线性组合中选取的F1应该是方差最大的,故称F1为第一主成分。

如果第一主成分不足以代表原来P 个指标的信息,再考虑选取F2即选第二个线性组合,为了有效地反映原来信息,F1已有的信息就不需要再出现再F2中,用数学语言表达就是要求Cov (F1,F2)=0,则称F2为第二主成分,依此类推可以构造出第三、第四,……,第P 个主成分[2]。

主成分分析首先是由K.皮尔森对非随机变量引入的,而后H.霍特林将此方法推广到随机向量的情形[2]。

信息的大小通常用离差平方和或方差来衡量。

在实际课题中,为了全面分析问题,往往提出很多与此有关的变量(或因素),因为每个变量都在不同程度上反映这个课题的某些信息。

但是,在用统计分析方法研究这个多变量的课题时,变量个数太多就会增加课题的复杂性。

人们自然希望变量个数较少而得到的信息较多。

在很多情形,变量之间是有一定的相关关系的,当两个变量之间有一定相关关系时,可以解释为这两个变量反映此课题的信息有一定的重叠。

主成分分析是对于原先提出的所有变量,建立尽可能少的新变量,使得这些新变量是两两不相关的,而且这些新变量在反映课题的信息方面尽可能保持原有的信息。

2主成分分析法在食品领域的应用2.1主成分分析在食品风味方面的应用目前,主成分分析应用还是比较广泛的,但是就食品风味方面,关于该分析方法的文献鲜见报道。

戴素贤等[3]人对七种高香型乌龙茶中的香气成分进行了主成分分析,他们尝试用主成分分析法来研究茶业香型的变化,并进而找到影响这些香型变化的主要化合物,同时还发现了不同的茶别中香气化合物变化的趋势并进行了模拟量化,直观地表现了各种香气化合物对香气的贡献程度。

李华等[4]运用多元统计分析确定葡萄酒感官特性,多元统计分析中的主成分分析等数学工具能够把大量的描述葡萄酒感官特性的描述语精简成较少的综合性更强的描述语,这些精简后的描述语不但能够反映精简前描述语的信息,还可以筛选出科学合理的描述符,描述符是描述分析的语言和工具,根据描述符可以分类不同的葡萄酒。

邵威平等[5]应用主成分分析法完成了不同品牌啤酒风味差异性的评价,同一品牌啤酒风味一致性的评价,同一品牌不同生产厂之间一致性的评价以及同一生产厂啤酒一致性的评价这些工作。

啤酒是个多指标的风味食品,主成分分析法可以帮助我们更好地研究啤酒理化指标和啤酒风格之间的相关性,从而达到更好地理解啤酒风味的目的。

岳田利等[6]人则通过利用主成分分析的方法建立了苹果酒香气质量的评价模型,并以此来对苹果酒样品香气组分进行客观的统计分析。

S.Kallithraka 等[7]采用高效液相色谱法和气相色谱法研究了希腊国内不同产地葡萄酒的化合物成分和感官特性,并运用了PCA 法(主成分分析法)对所得参数进行多元分析,最终达到给葡萄酒评价和分类的目的。

2.2主成分分析在食品品质方面的应用食品品质的评价往往是非常复杂的过程。

因为影响食品品质的因素大量存在,非人为因素如食品环境中的微生物,温度及pH 等的变化带来的影响。

另一方面,由于人为的因素掺假也会造成食品品质的低劣,进而损害广大销售者和消费者的利益。

如黎海红等[8]人运用主成分分析法对掺伪芝麻油的检测方法进行研究分析。

根据主成分分析的实验原理,可以选择芝麻油的折光率、酸价、色泽、水分及挥发物、皂化值和碘价等理化指标作为变量,将这些变量的所测数据做矩阵处理最后分析就轻工科技LIGHT INDUSTRY SCIENCE AND TECHNOLOGY2012年9月第9期(总第166期)食品与生物主成分分析法及其应用苏键,陈军,何洁(广西轻工业科学技术研究院,广西南宁530031)【摘要】介绍了主成分分析法的定义、原理,概述了该法在食品及一些仪器分析领域的应用,目的是为其他还未应用该分析方法的学术领域提供一种参考和借鉴,使得主成分分析法能够在越来越多的学术领域中得以推广和应用。

【关键词】主成分分析;应用;概述【中图分类号】TS262【文献标识码】A【文章编号】2095-3518(2012)09-12-02能知道掺伪芝麻油的主成分及其贡献率。

我们知道,芝麻油掺杂了其他的植物油,其理化指标就会出现变化,这是质量鉴别的基础和依据。

利用主成分分析可以从大量的数据中提取与芝麻油掺伪相关的有用的信息,最终可以较好地区分掺杂有其他植物油的芝麻油。

采用主成分分析方法还可以评价分析面条的品质[9],面条品质的感官评价存在着一定的缺陷,在面条品质评价的过程中,需要对大量的待测样本属性进行测量,在这些属性中有一些是由相互关联的数据组成的,如面条的韧性会影响面条的拉断力和平均拉力,因此,拉断力和平均拉力是相关的,倘若在预测韧性的相应等式中同时用到了拉断力和平均拉力,那么预测出的韧性要比实际韧性大,因为进行了重复计算,所以一定要确保等式中的变量之间尽可能地保持独立,主成分分析在这样的情况下通过对一组影响某一问题的相关变量进行线性变换,使得变换后得到的变量独立不相关就叫做主成分,这样的主成分不仅保留了原来相关变量中的主要信息,彼此间又不相关。

面条品质通过主成分分析法得到的综合评价与主观评价(外观、色泽、适口性、咬劲、弹性、黏性、食味等)有相似之处,但是它比主观评价更加细化,对具体样本进行了量化,为面条品质的进一步分析提供了可靠的参考依据。

主成分分析法还可以应用于保健食品功能学评价的研究[10],评价保健食品的功能特性—对抗疲劳和耐缺氧作用。

利用主成分分析对包括受试小鼠外周血象和血清等23项生化指标进行综合分析,科学合理地“降维”后,克服了多指标综合评价带来的统计和分析,筛选出与抗疲劳和耐缺氧功效最直接相关的主要功效指标,依据主要考核变量的综合评分最终确定受试样品的功效特性大小。

可见,主成分分析法可以作为一种方便、快捷和准确的量化评价功能学特性的新方法。

3主成分分析法在其它领域的应用3.1主成分分析在近红外光谱中的应用[11]近红外光谱相当于分子的倍频和组频产生的振动光谱,波长范围1100~2500nm。

有机化合物在该区均有吸收,但吸收强度较弱,谱带较宽,样品谱带重叠严重,以致在样品光谱中看不到组分的特征吸收。

这就决定了该法适用于样品中主要组分的常量分析。

但化学计量学可以有效地解决这个问题,其中PCA在近红外光谱的研究中应用较多。

主成分分析法是多元统计中的一种数据压缩技术,在不丢失主要光谱信息的前提下选择为数较少的新变量来代替原来较多的变量,解决了由于谱带的重叠而无法分析的困难。

另外,液态样品可不加稀释与处理就能直接进行分析测试,实现非破坏性的分析,但其谱带较宽,样品中各组分光谱重叠严重。

任玉林等人的研究表明,与主成分分析法相结合,近红外光谱法在非破坏无损分析中的应用具有很大的潜力。

将主成分分析法引入到近红外光谱中,可以有效地解决近红外光谱谱带重叠严重的问题,由此可以发挥近红外光谱法简便、快速、非破坏性的优点。

主成分分析法常被用来解析混合物的近红外光谱图,从而提取所需的化学信息,根据纯物质的物理化学性质预测混合物的物理化学性质,鉴定官能团及分子结构。

主成分分析法也经常被用在傅里叶变换一红外光谱解析中。

例如:研究人员将主成分分析法应用到傅里叶变换一红外光谱中,分别测定了聚甲基丙烯酸丁酯LB(Lang-muir—Blodgett)膜玻璃化转变温度和牛的血清蛋白(BSA)在极性溶液中的水合作用和二次结构发生转变的温度。

对近红外漫反射光谱进行主成分分析,可说明在主成分分析过程中所产生的新变量如何提供新光谱信息,从而改善对原始光谱数据的解释。

3.2主成分分析在核磁共振技术中的应用[11]PCA方法是核磁共振光谱数据多变量分析中常用的运算法则,它充分地减小了含大量相关变量的数据的复杂性,使计算机的效率最优化,降低仪器噪音,同时使小化学位移的变化最小化,预测复杂结构的核磁共振光谱参数,从而分离复杂体系。

主成分分析法可以同时对数据集中所有的谱进行分解,来获取它们的基本特征,即主成分,它不需要预先对波谱的形状等进行假定,即不需要有关的先验知识;另一方面,MRS数据集中,各谱一般恰恰具有这种共同的基本信息,如基本的波形函数等,所以在MRS参数量化及校正中,主成分分析法有着独特的优势。

在运用主成分分析法解析核磁共振光谱时,样品矩阵的变化和仪器本身的不稳定性将导致样品的核磁共振光谱峰位和峰形均发生变化。

Jenny使用线性内插法和转换校正对其进行改进,以增强多变量模式的解释能力,并对2种校正方法作了比较。

3.3主成分分析在滴定分析中的应用相干扰多组分不经分离的同时化学测定,已引起国内外分析工作者的重视。

PCA方法在滴定分析中应用的基本原理是将已知混合液测定数据中能代表多组分特性的有效信息,以主成分向量形式逐步提取出来,把代表测量误差的次要成分向量忽略,进而建立回归形式的数学模型,以测定试液中各组分浓度或含量。

应用主成分分析法,将电位滴定、数学计算法和计算机技术三者有机地结合在一起,用现代数学分离法代替繁琐的化学分离或掩蔽法,其突出优点是无需知道酸的电离常数,也无需对电极系统进行严格校正,只需准确测定几个pH点所消耗滴定剂的体积即可。

该分析法方法简单,易于操作,省时省力,节约药品,测定成本大大降低,是一种很有应用价值的分析方法。

4总结主成分分析法是一种降维的统计方法,它可以用尽量少的综合指标代替众多的原始数据,并尽可能多地反映原始数据所提供的信息。

这种方法引起了人们的兴趣,并在各自的实际工作中得到了推广应用。

但是,在实际计算和应用中也会出现一些问题,有时会得出似是而非的结论。

例如:准确地计算和合理地解释主成分分析法是应用于实际的数学方法,计算准确固然重要,但更为重要的是对主成分的具有实际意义的合理解释。

相关主题