当前位置:文档之家› 数学建模题目及其答案

数学建模题目及其答案

数学建模疾病的诊断现要你给出疾病诊断的一种方法。

胃癌患者容易被误诊为萎缩性胃炎患者或非胃病者。

从胃癌患者中抽取5人(编号为1-5),从萎缩性胃炎患者中抽取5人(编号为6-10),以及非胃病者中抽取5人(编号为11-15),每人化验4项生化指标:血清铜蓝蛋白(X)、1蓝色反应(X)、尿吲哚乙酸(3X)、中性硫化物(4X)、测得数据如表1 2所示:表1. 从人体中化验出的生化指标根据数据,试给出鉴别胃病的方法。

论文题目:胃病的诊断摘要在临床医学中,诊断试验是一种诊断疾病的重要方法。

好的诊断试验方法将对临床诊断的正确性和疾病的治疗效果起重要影响。

因此,对于不同疾病不断发现新的诊断试验方法是医学进步的重要标志。

传统的诊断试验方法有生化检测、DNA检测和影像检测等方法。

而本文则通过利用多元统计分析中的判别分析及SPSS软件的辅助较好地解决了临床医学中胃病鉴别的问题。

在临床医学上,既提高了临床诊断的正确性,又对疾病的治疗效果起了重要效果,同时也减轻了病人的负担。

判别分析是在分类确定的条件下,根据某一研究对象的各种特征值判别其类型归属问题的一种多变量统计分析方法。

其基本原理是按照一定的判别准则,建立一个或多个判别函数,用研究对象的大量资料确定判别函数中的待定系数,并计算判别指标。

首先,由判别分析定义可知,只有当多个总体的特征具有显著的差异时,进行判别分析才有意义,且总体间差异越大,才会使误判率越小。

因此在进行判别分析时,有必要对总体多元变量的均值进行是否不等的显著性检验。

其次,利用判别分析中的费歇判别和贝叶斯判别进行判别函数的建立。

最后,利用所建立的判别函数进行回判并测得其误判率,以及对其修正。

本文利用SPSS软件实现了对总体间给类变量的均值是否不等的显著性检验并根据样本建立了相应的费歇判别函数和贝叶斯判别函数,最后进行了回判并测得了误判率,从而获得了在临床诊断中模型,给临床上的诊断试验提供了新方法和新建议。

关键词:判别分析;判别函数;Fisher判别;Bayes判别一问题的提出在传统的胃病诊断中,胃癌患者容易被误诊为萎缩性胃炎患者或非胃病患者,为了提高医学上诊断的准确性,也为了减少因误诊而造成的病人死亡率,必须要找出一种最准确最有效的诊断方法。

为诊断疾病,必须从人体中提取4项生化指标进行化验,即血清铜蓝蛋白、蓝色反应、尿吲哚乙酸、中性硫化物。

但是,从人体中化验出的生化指标,必须要确定一个精准的指标来判断疾病所属的类型。

设想,使用判别分析法,利用SPSS 软件对各个变量进行系统的分析,使该问题得到有效地解决。

二、问题的分析由题意可知,目的就是为了建立一种模型,解决医学上的这种误诊问题。

在该问题中,必须确定血清铜蓝蛋白、蓝色反应、尿吲哚乙酸、中性硫化物与胃癌、萎缩性胃炎的关系。

衡量该四项指标的数学要点必然是相应的标准差、方差、均值等,同时,会建立一个或几个函数分析其间关系的正相关或负相关,即其具有一定的相关性,然后利用所给数据求解出一定的数学模型表达式,便可求解出胃病的鉴别方法。

三、符号的说明X1:血清铜蛋白X2:蓝色反应X3:尿吲哚乙酸X4:中型硫化物N:被调查的样本数Wilks的lambda:组内平方和与总平方和之比(当所有观测的组均值相等时,Wilks的lambda值为1;当组内变异与总变异相比小时,Wilks的lambda值接近于0。

因此,Wilks的lambda值大,表示各个组的均值基本相等;Wilks的lambda小表示组间有差异。

在判别分析中,只有组均值不等时,判别分析才有意义)F:F值,F分布中的统计检定值df:自由度sig.:统计显著性,即出现目前样本的机率P:p值四、问题的假设1.该四项生化指标是分别可以测得的。

2.每个生化指标都不是其他三个指标的线性组合,即两两之间无相关性。

3.被抽取的三类人员中彼此没有任何血缘关系。

4.除了本题研究的疾病外,被调查的人员无任何疾病。

五、模型的建立根据以上的分析,回忆所学的知识,发现该问题符合判别分析法的要求,因此可以用判别分析法来求解,其中,判别分析法可以分为:距离判别法、Fisher 判别法、Bayes 判别法等。

SPSS 软件是统计分析软件之一,它可以进行各种统计分析工作。

另外,它所具有的强大的图形输出功能,使运行该软件不仅可以得到各种数字分析结果,还可以得到各种直观、清晰、漂亮的统计图形。

从而利用软件SPSS ,将所有的数据输入进去,便可以得到协方差矩阵、自由度、p 值、均值、标准差等与该问题相关的有利于分析问题的数据及图形。

现在主要利用Fisher 判别法、Bayes 判别法来处理该问题。

Fisher 判别法的基本思想: 从k 个总体中抽取具有p 个指标的样品观测数据,借助方差分析的构造一个线性判别函数:1122()p p U u X u X u X '=+++=X u X ,其中系数),,,(21'=p u u u u 确定的原则是使得总体之间区别最大,而使每个总体内部的离差最小。

有了线性判别函数U 后,对于一个新的样品,将它的p 个指标值代入以上线性判别函数式中求出()U X 值,然后根据判别一定的规则,就可以判别新的样品属于哪个总体。

Bayes 判别法的基本思想:设有k 个总体k G G G ,,,21 ,其各自的分布密度函数)(,),(),(21x x x k f f f 互不相同的,假设k 个总体各自出现的概率分别为k q q q ,,,21 (先验概率),0≥i q ,11=∑=ki i q 。

假设已知若将本来属于i G 总体的样品错判到总体j G 时造成的损失为)|(i j C ,k j i ,,2,1, =。

在这样的情形下,对于新的样品X 判断其来自哪个总体。

通过这两种方式利用软件SPSS 来求解,得出的数据在分析比较后,就可以得出结果。

六、模型的求解1.spss 操作步骤如下 (1)建立数据文件在数据窗口中输入上入待分析的数据。

(2)按顺序单击分析→分类→判别菜单项,如图-1所示,系统弹出判别分析的对话框,如图-2所示图-1 先选择菜单进入判别分析对话框注:X1:血清铜蛋白X2:蓝色反应X3:尿吲哚乙酸X4:中型硫化物(3)选择参与判别分析的变量及其他相关设置1)分组变量框:从左侧选入分类变量“类型”于分组变量框中。

2)定义范围按钮:定义分类变量的取值范围。

单击分类变量按钮,系统弹出一个对话框,如图-3所示。

最小值输入1,最大只输入3.完成设置后,单击继续按钮,返回判别分析主对话框,见图-2.图-2 判别分析的主对话框图-3 指定分类变量范围对话框3)自变量列表框:从左侧的变量列表将参与判别分析的变量“X1—X4”于其中,如图-4所示。

4)一起输入变量单按钮:表示选择所有变量参与判别分析,如图-4所示。

图-4(4)判别分析的统计输出设置。

单击统计量按钮,系统弹出一个对话框,如图-5所示。

图-5 判别分析的统计输出设置1)描述性框:描述统计量选项组,包括3个复选框项,复选均值复选框和单变量复选框。

如图-5所示均值复选框:各类中个变量的均值、标准差和各自变量总样本的均值、标准差;单变量复选框:变量均值的单因子差异假设实验。

2)函数系数框:判别函数系数选项组,复选Fisher复选框和未标准化复选框,如图-5所示。

Fisher复选框:给出贝叶斯判别函数的系数。

未标准化复选框:给出未标准化的Fisher判别函数的系数。

(5)指定判别分析的有关参数及有关输出结果设置。

单击分类按钮,系统弹出一个对话框,如图-6所示。

图-6 指定参数与结果对话框1)先验概率框:先验概率选项组,包括两个单选项,单选所有组相等框如图-6所示。

所有组相等框:个二类先验概率相等。

2)输出框:分类结果选项组,包括三个复选项,复选个案结果、摘要表和不考虑该个案时的分类复选框如图-6所示。

个案结果复选项:对每个样品输出判别函数值、实际类、预测类和后验概率。

摘要表复选项:输出分类小结,给出正确分类的样品数、错分样品数和错分率。

不考虑该个案时的分类复选项:交叉验证的判别分类结果。

3)使用协方差矩阵框:分类使用的协方差矩阵,单选在组内单选项如图-6所示。

在组内单选项:使用合并类内协方差矩阵。

4)图框:复选合并组、分组和区域图复选框如图-6所示。

合并组复选项:使出包括各个类的散点图。

分组复选项:每类输出一个散点图。

区域图复选项:输出领域图。

所有设置完成后,单击继续按钮返回判别分析主对话框。

图-7 建立新变量对话框(6)单击保存按钮,系统弹出一个对话框,复选预测组成员、判别得分和组成员概率复选项如图-7所示。

1)预测组成员复选项:根据判别函数的值,按后验概率计算预测分类结果。

2)判别得分复选项:建立判别函数值变量。

3)组成员概率复选项:建立新变量,表明每一个样品属于某一类的概率。

所有设置完成后,单击继续按钮返回判别分析主对话框。

(7)上述设置完成后,单击确定按钮进行判别分析,得到输出结果。

七、模型的结果(1)描述性输出分析案例处理摘要未加权案例N 百分比有效15 100.0排除的缺失或越界组代码0 .0至少一个缺失判别变量0 .0缺失或越界组代码还有至少一0 .0个缺失判别变量合计0 .0合计15 100.0图-8图-8表示有效样本及样本变量的实际情况。

图-9由图-9可知显著水平X2、X3最大,而X1、X4显著水平最小。

但是由于判别变量间可能相互关联,仅单独检验是不够的。

但是通过将X1和X4分别与X2和X3联合后发现,他们对判别的提高有很大的贡献。

组统计量类型均值标准差有效的 N(列表状态)未加权的已加权的1 x1 188.6000 57.13843 5 5.000x2 150.4000 16.50152 5 5.000x3 .1380 .05933 5 5.000x4 .2000 .13323 5 5.0002 x1 163.0000 53.80520 5 5.000x2 115.0000 14.81553 5 5.000x3 .0700 .01871 5 5.000x4 .1360 .07537 5 5.0003 x1 151.0000 33.80089 5 5.000x2 121.4000 13.01153 5 5.000x3 .0500 .01871 5 5.000x4 .0900 .06782 5 5.000合计x1 167.5333 48.47513 15 15.000x2 128.9333 21.04915 15 15.000x3 .0860 .05221 15 15.000x4 .1420 .10094 15 15.000图-10上表(图-10)表示各组变量的描述统计情况,给出了各个类型的均值、标准差等统计量。

相关主题