用聚类分析法分析细菌性食物中毒学号:1110110047姓名:何昌业摘要:探讨我国细菌性食物中毒的发生规律,为预防细菌性食物中毒的发生提供参考。
将收集的1994—2003年766起细菌性食物中毒案件的发生情况利用SPSS软件进行聚类分析,按其中毒发生情况将全部23种细菌中毒情况分为4类。
本文选取了细菌性食物中毒的报道起数、中毒人数、死亡人数的统计量作为研究数据。
各项数据均来自于万方数据搜索。
分析结果表明:细菌性食物中毒有其规律性,根据其内在的特点,采取相应的预防措施,将有助于预防其发生。
关键词:食物中毒细菌性食物中毒聚类分析引言:随着生活水平的不断提高,我们的食物也越来越丰富,但随之食物中毒的情况也越来越多。
其中细菌性食物中毒比较常见,对人们生活习惯影响较大。
因此,本文对1994—2003年766起细菌性食物中毒案件的具体情况进行聚类分析。
首先对引起细菌性食物中毒的细菌进行聚类,将全部细菌分为4类,然后对中毒人数、死亡人数、中毒原因等进行分析。
通过本文的分析研究,可以清楚地了解细菌性食物中毒的分布情况,以及发生中毒的原因,最终对细菌性食物中的预防起指导作用。
2 聚类分析的原理与方法2.1主要思想及原理主要思想:先将待聚类的n个样品(或者变量)各自看成一类,共有n类;然后按照实现选定的方法计算每两类之间的聚类统计量,即某种距离(或者相似系数),将关系最为密切的两类合为一类,其余不变,即得到n-1类;再按照前面的计算方法计算新类与其他类之间的距离(或相似系数),再将关系最为密切的两类并为一类,其余不变,即得到n-2类;如此下去,每次重复都减少一类,直到最后所有的样品(或者变量)都归为一类为止。
聚类分析的原理:直接比较样本中各事物之间的性质,,将性质相近的归为一类,而将性质差别比较大的分在不同类。
也就是说,同类事物之间的性质差异小,类与类之间的事物性质相差较大。
其中欧式距离在聚类分析中用得最广,它的表达式如下:其中Xik表示第i个样品的第k个指标的观测值,Xjk表示第j个样品的第k个指标的观测值,dij为第i个样品与第j个样品之间的欧氏距离。
若dij越小,那么第i与j两个样品之间的性质就越接近。
性质接近的样品就可以划为一类。
当确定了样品之间的距离之后,就要对样品进行分类。
分类的方法很多,这里只介绍系统聚类法,它是聚类分析中应用最广泛的一种方法。
首先将n个样品每个自成一类,然后每次将具有最小距离的两类合并成一类,合并后重新计算类与类之间的距离,这个过程一直持续到所有样品归为一类为止。
2.2方法步骤应用系统聚类法进行聚类分析的步骤如下:①确定待分类的样品的指标;②收集数据;③对数据进行变换处理(如标准化或规格化);④使各个样品自成一类,即n个样品一共有n类;⑤计算各类之间的距离,得到一个距离对称矩阵,将距离最近的两个类并成一类;⑥并类后,如果类的个数大于1,那么重新计算各类之间的距离,继续并类,直至所有样品归为一类为止;⑦最后绘制系统聚类谱系图,按不同的分类标准或不同的分类原则,得出不同的分类结果。
2.3适用范围聚类分析在商业方面可以用来当细分市场的有效工具,同时也可用于研究消费者行为;在生物方面聚类分析被用来动植物分类和对基因进行分类,获取对种群固有结构的认识;在地理方面聚类能够帮助在地球中被观察的数据库商趋于的相似性;在食品安全方面聚类分析可以用来进行进行分类具体检查等。
另外在天文学、考古学、医药、化学、心理学、语言学和社会学等方面也用到聚类分析。
3.基于聚类解决。
3.1问题描述收集了1994—2003年766起细菌性食物中毒案件的23中细菌的中毒详细统计情况,研究这些细菌中毒案件的细菌之中有什么关系,探究这些细菌有没有什么相同之处以及这些中毒案件发生的原因,以便以后更好地进行预防。
3.2问题分析要想研究这些细菌之中的联系及相同特征,则应通过把每种细菌的报道起数、中毒人数、死亡人数和发生具体状况及原因等这些因素联系在一起,看看它们之间有什么关系,然后进行具体分类。
因此应该使用系统聚类法进行聚类分析,把它们之间具有相似性质的归到一起,研究它们的发生情况,这样才能更好得探究出它们的相同之处以及这些中毒案件发生的原因,为以后的细菌性食物中毒的预防起指导作用。
3.3.。
问题的聚类模型及求解聚类分析:a)系统聚类法:(1)在SPSS窗口中选择分析→分类→系统聚类,调出系统聚类分析主界面,并将变量移入变量框中。
在分群栏中选择个案单选按钮,即对样品进行聚类(若选择变量,则对变量进行聚类)。
在输出栏中选择统计量和图复选框,这样在结果输出窗口中可以同时得到聚类结果统计量和统计图。
图5.1 系统分析法主界面(2)点击统计量按钮,设置在结果输出窗口中给出的聚类分析统计量。
我们选择合并进程表与聚类成员中的方案范围2-4,如图5.2所示,点击继续按钮,返回主界面。
(其中,合并进程表表示在结果中给出聚类过程表,显示系统聚类的详细步骤;相似性矩阵表示输出各个体之间的距离矩阵;聚类成员表示在结果中输出一个表,表中显示每个个体被分配到的类别,方案范围2-4即将所有个体分为2至4类。
)(3)点击绘制按钮,设置结果输出窗口中给出的聚类分析统计图。
选中树状图复选框和冰柱栏中的无单选按钮,如图5.3,即只给出聚类树形图,而不给出冰柱图。
单击继续按钮,返回主界面。
图5.2 统计量子对话框图5.3 绘制子对话框(4)点击方法按钮,设置系统聚类的方法选项。
聚类方法下拉列表用于指定聚类的方法,这里选择组间连接(组间平均数连接距离);度量标准栏用于选择对距离和相似性的测度方法,选择区间中的平方Euclidean距离(欧氏距离);单击继续按钮,返回主界面。
图5.4 方法子对话框图5.5 保存子对话框(5)点击保存按钮,指定保存在数据文件中的用于表明聚类结果的新变量。
无表示不保存任何新变量;单一方案表示生成一个分类变量,在其后的矩形框中输入要分成的类数;方案范围表示生成多个分类变量。
这里我们选择方案范围,并在后面的两个矩形框中分别输入2和4,即生成三个新的分类变量,分别表明将样品分为2类、3类和4类时的聚类结果,如图5.5。
点击继续,返回主界面。
(6)点击确定按钮,运行系统聚类过程。
4结果与讨论聚类分析群集成员表及聚类分析系谱图* * * * * * * * * * * * * * * * * * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S * * * * * * * * * * * * * * * * * * * Dendrogram using Average Linkage (Between Groups)Rescaled Distance Cluster CombineC A S E 0 5 10 15 20 25Label Num +---------+---------+---------+---------+---------+16 -+22 -+19 -+21 -+17 -+18 -+15 -+13 -+14 -+-+9 -+ |20 -+ |12 -+ |23 -+ +---------+10 -+ | |11 -+ | |8 -+ | +-----------------------------------+5 ---+ | |4 -+ | |6 -+-----------+ |3 -+ |7 -+ |1 -+-----------------------------------------------+2 -+从上面图中可以直观地看出各种食物中毒细菌形状的区别和相互联系程度,从图中可以看出副溶血性弧菌、沙门菌为一类;蜡样芽孢杆菌、变形杆菌、混合细菌、大肠埃希菌为第二类;金黄色葡萄球菌为第三类;剩下的为第四类。
对于分析结果的讨论:随着经济的快速发展,人们通过各种途径在各种场合可以吃到的食物越来越丰富,但随之出现细菌性食物中毒的现象也越来越多。
而由于地域、场所和生活习惯等的不同,导致引起细菌性食物中毒的细菌种类也是繁多。
其中以副溶血性弧菌、沙门菌这两种细菌引起的细菌性食物中毒最多最常见,这是由于这两种菌类在生活食物中比较常见,多存在于动物性食品及海鲜类食品中,且存活能力比较强,人们烹饪食物卫生做得不够彻底及未煮熟煮透比较容易感染到。
而像蜡样芽孢杆菌、变形杆菌、混合细菌、大肠埃希菌这几种菌类引起的细菌性食物中毒也比较常见,这几种细菌性食物大多是由于使用错误地烹调方法造成细菌孢子残留在食物上或者食物被不当冷冻引起的。
而像剩下的那些细菌种类引起的情况占的比例算少数,它们的存活能力比较弱,分布场所比较狭小。
通过本文的分析研究,可以清楚地了解到引起细菌性食物中毒的各种细菌的分布情况,以及各种细菌中毒的发生原因及组成。
最终对细菌性食物中的预防起指导作用。
细菌性食物中毒重在预防,人们应建立良好的饮食卫生习惯,生活中烹饪食物应该煮熟煮透,烹调方法应该得当,保存方法应该正确等,同时大力监督社会食品卫生状况,积极切断传播途径。
一旦发生可疑食物中毒,立刻上报有关部门,及早控制疫情。
5 参考文献[1]中国卫生年鉴[2]张肃1985-2000年我国食物中毒情况重点分析中国食品卫生杂志[3]朱建平编著:《应用多元统计分析》.科学出版社[4]万方数据。