当前位置:文档之家› 模式识别实验报告iris

模式识别实验报告iris

4.已经估计出三类数据的统计特征。首先使用最小错误判别准则进行分类,实验中采用对数形式计算,假设三种类型的先验概率相等,即均为1/3,在某一X下得到的三个后验概率的函数。比较三个值的大小,哪个最大,就可判断X属于哪一类。最后进行了分类器判据结果的验证。
5.再使用最小风险判别准则进行分类,实验中扔采用对数形式计算,假设三种类型的先验概率相等,即均为1/3。设计出风险参数矩阵L,该数据可根据实际损失的情况需要进行修改。将X代入得到三个数值,哪个最小,即为风险最小,便属于该类型。最后同样进行了判别结构的验证。
该公式体现了先验概率、类条件概率、后验概率三者的关系。
其中,类条件概率密度函数 为正态密度函数,用大量样本对其中未知参数进行估计,多维正态密度函数为
式中, 为n维向量;
为n维均值向量;
为n维协方差矩阵;
是 的逆矩阵;
是 的行列式。
大多数情况下,类条件密度可以采用多维变量的正态密度函数来模拟。
为 类的均值向量。
对于“判断第84个数据属于第3类”的分类是错误的!
判断第85个数据属于第2类
判断第86个数据属于第2类
判断第87个数据属于第2类
判断第88个数据属于第2类
判断第89个数据属于第2类
判断第90个数据属于第2类
判断第91个数据属于第2类
判断第92个数据属于第2类
判断第93个数据属于第2类
判断第94个数据属于第2类
2.最小风险判别准则
1设计风险因子矩阵L规则如下:
得到的识别结果同第一种方法相同,即如上所示的三张图。
例如在计算第一类风险时,按此规则, 改写为
当不发生判错时, , , 为最大,判为第一类,和最小错误判别准则一致;当发生判错时, , 或 , 不是最大值,该X不被判为第一类,和最小错误判别准则一致。因此,在这种设计规则下,两种方法一致。
3.最小风险判别准则
对观测值 条件下,各状态后验概率求加权和的方式,表示风险如下:
其中, 为将第j类判为第i类的损失。若判对i=j,则 取负值或零值,表示没有损失;若判对i j,则 取正值,数值大小表示损失多少。
对得到的M个类型的风险值 进行比较,得到使条件风险最小的类别,判别X属于该类别。
二、实验过程
判断第48个数据属于第1类
判断第49个数据属于第1类
判断第50个数据属于第1类
判断第51个数据属于第2类
判断第52个数据属于第2类
判断第53个数据属于第2类
判断第54个数据属于第2类
判断第55个数据属于第2类
判断第56个数据属于第2类
判断第57个数据属于第2类
判断第58个数据属于第2类
判断第59个数据属于第2类
判断第28个数据属于第1类
判断第29个数据属于第1类
判断第30个数据属于第1类
判断第31个数据属于第1类
判断第32个数据属于第1类
判断第33个数据属于第1类
判断第34个数据属于第1类
判断第35个数据属于第1类
判断第36个数据属于第1类
判断第37个数据属于第1类
判断第38个数据属于第1类
判断第39个数据属于第1类
判断第72个数据属于第2类
判断第73个数据属于第2类
判断第74个数据属于第2类
判断第75个数据属于第2类
判断第76个数据属于第2类
判断第77个数据属于第2类
判断第78个数据属于第2类
判断第79个数据属于第2类
判断第80个数据属于第2类
判断第81个数据属于第2类
判断第82个数据属于第2类
判断第83个数据属于第2类
判断第40个数据属于第1类
判断第41个数据属于第1类
判断第42个数据属于第1类
判断第43个数据属于第1类
判断第44个数据属于第1类
判断第45个数据属于第1类
判断第46个数据属于第1类
判断第47个数据属于第1类
判断第48个数据属于第1类
判断第49个数据属于第1类
判断第50个数据属于第1类
判断第51个数据属于第2类
实验环境:MATLAB R2009a
1.将txt格式下的IRIS数据导入实验环境中。实验中设计了对话框,可直接选择存放该文件的路径并导入。
2.将读入的数据进行逐行录入,按行录入在1*150的数组iris中,每一个元素中包含一个四维向量。
3.通过计算,分别估计出三类的统计特征值,即正态分布的两个重要参数均值 和方差 。 , 。以下程序段为第一类特征值求取过程,第二、三类相似,实验中,取第偶数个向量为训练样本。
判断第60个数据属于第2类
判断第61个数据属于第2类
判断第62个数据属于第2类
判断第63个数据属于第2类
判断第64个数据属于第2类
判断第65个数据属于第2类
判断第66个数据属于第2类
判断第67个数据属于第2类
判断第68个数据属于第2类
判断第69个数据属于第2类
判断第70个数据属于第2类
对于“判断第71个数据属于第3类”的分类是错误的!
判断第16个数据属于第1类
判断第17个数据属于第1类
判断第18个数据属于第1类
判断第19个数据属于第1类
判断第20个数据属于第1类
判断第21个数据属于第1类
判断第22个数据属于第1类
判断第23个数据属于第1类
判断第24个数据属于第1类
判断第25个数据属于第1类
判断第26个数据属于第1类
判断第27个数据属于第1类
判断第52个数据属于第2类
判断第53个数据属于第2类
判断第54个数据属于第2类
判断第55个数据属于第2类
判断第56个数据属于第2类
判断第57个数据属于第2类
判断第58个数据属于第2类
判断第59个数据属于第2类
判断第60个数据属于第2类
判断第61个数据属于第2类
判断第62个数据属于第2类
判断第63个数据属于第2类
判断第129个数据属于第3类
判断第130个数据属于第3类
判断第131个数据属于第3类
对于“判断第132个数据属于第2类”的分类是错误的!
判断第133个数据属于第3类
对于“判断第134个数据属于第2类”的分类是错误的!
判断第135个数据属于第3类
判断第136个数据属于第3类
判断第137个数据属于第3类
三、实验结果与分析
1.最小错误判别准则
判断第1个数据属于第1类
判断第2个数据属于第1类
判断第3个数据属于第1类
判断第4个数据属于第1类
判断第5个数据属于第1类
判断第6个数据属于第1类
判断第7个数据属于第1类
判断第8个数据属于第1类
判断第9个数据属于第1类
判断第10个数据属于第1类
判断第11个数据属于第1类
判断第24个数据属于第1类
判断第25个数据属于第1类
判断第26个数据属于第1类
判断第27个数据属于第1类
判断第28个数据属于第1类
判断第29个数据属于第1类
判断第30个数据属于第1类
判断第31个数据属于第1类
判断第32个数据属于第1类
判断第33个数据属于第1类
判断第34个数据属于第1类
判断第35个数据属于第1类
判断第95个数据属于第2类
判断第96个数据属于第2类
判断第97个数据属于第2类
判断第98个数据属于第2类
判断第99个数据属于第2类
判断第100个数据属于第2类
判断第101个数据属于第3类
判断第102个数据属于第3类
判断第103个数据属于第3类
判断第104个数据属于第3类
判断第105个数据属于第3类
判断第106个数据属于第3类
判断第4个数据属于第1类
判断第5个数据属于第1类
判断第6个数据属于第1类
判断第7个数据属于第1类
判断第8个数据属于第1类
判断第9个数据属于第1类
判断第10个数据属于第1类
判断第11个数据属于第1类
判断第12个数据属于第1类
判断第13个数据属于第1类
判断第14个数据属于第1类
判断第15个数据属于第1类
2根据需要可以改变风险因子矩阵L,当判错第j类为第i类损失较大时,设计 去较大的值。从最小错误判别准则的实验中可以看到,有两个第二类数据判为第三类,两个第三类数据判为第二类,因此将 略增大一点,使损失变大,以减少这样的错误。
设计 时,得到如下结果:
判断第1个数据属于第1类
判断第2个数据属于第1类
判断第3个数据属于第1类
判断第12个数据属于第1类
判断第13个数据属于第1类
判断第14个数据属于第1类
判断第15个数据属于第1类
判断第16个数据属于第1类
判断第17个数据属于第1类
判断第18个数据属于第1类
判断第19个数据属于第1类
判断第20个数据属于第1类
判断第21个数据属于第1类
判断第22个数据属于第1类
判断第23个数据属于第1类
判断第36个数据属于第1类
判断第37个数据属于第1类
判断第38个数据属于第1类
判断第39个数据属于第1类
判断第40个数据属于第1类
判断第41个数据属于第1类
判断第42个数据属于第1类
判断第43个数据属于第1类
判断第44个数据属于第1类
判断第45个数据属于第1类
判断第46个数据属于第1类
判断第47个数据属于第1类
2.最小错误判别准则
1两类问题
有两种形式,似然比形式:
其中, 为似然比, 为似然比阈值。
对数形式:
2多类问题
本实验采取针对多累问题的解决方法。在待测向量 的条件下,看哪个类的概率最大,应该把 归于概率最大的那个类。因此,可以通过比较各个判别函数来确定 的类型。
相关主题