毕业论文(2014 届)题目回归分析在医学中的应用学院数学计算机学院专业数学与应用数学年级2010级3班学生学号***********学生姓名蔡慧指导教师纳艳萍2014年5月8 日毕业论文任务书附表一毕业论文开题报告毕业论文教师指导情况附表三毕业论文评价表附表四说明:指导教师、评阅人和答辩小组按百分制赋分,各项所占比重参考值分别为:40%、20%、40%,各学院也可根据专业特点和要求自行调整,但必须在表中明确标识。
最终成绩由教学秘书核计。
回归分析在医学中的应用摘要:在处理测量数据的过程中,经常需要研究变量与变量之间的关系。
变量之间的关系一般分为两种。
一种是完全确定关系,即函数关系;一种是相关关系,即变量之间既存在着密切联系,但又不能由一个或多个变量的值求出另一个变量的值。
而回归分析方法是处理多个变量之间相互关系的一种数学方法,是数理统计常用方法之一。
从分析测试的观点来看,回归分析的任务就是找出响应值yx,(自变量,i= 1 ,2 ,3 , …n)之间的统计关(因变量)与影响它的诸因素i系(回归模型)本文主要介绍了多元回归分析的主要内容并对病人的血压、血糖、胆固醇、甘油三酯进行相关分析研究。
关键字:回归分析回归方程因变量自变量Application of regression analysis in medicineAbstract: The process of measurement data, often need to examine the relationship between variables and variables. The relationship between variables is generally divided into two kinds. Is a completelydetermine the relationship, namely the function relationship; one isrelated to the variables, both closely linked, but not by one or more ofthe value of a variable for the value of another variable. And the method ofregression analysis is a mathematical method of the relationship between multiple variables, is one of the common methods of mathematical statistics. From the point ofview of analysis of test,regression analysis of the task is to find the response value (the dependent variable) and the factors affecting it, (variable, = 1, 2, 3,...)The statistical relationship between (regression model) this paper mainly introduces themain content of multiple regression analysisBlood pressure, blood glucose, cholesterol, triglyceride in patients of correlation analysis.Keywords: Regression analysis Regression equation dependent variable Variables目录1 引言 (7)2相关定义 (9)2.1回归分析的基本定义 (9)2.2多元回归分析定义 (9)2.3多元回归分析的基本模型 (9)2.3.1参数B的最小M乘估计 (10)2.4一些非线性回归方程的线性处理方式 (12)3多元线性回归分析在医学中的应用 (14)4 结论 (20)参考文献 (20)谢辞 (20).1引言回归分析是研究一个变量关于另一些变量的依赖关系的计算方法和理论基础, 其目的在于通过后者的已知或设定值去估计或预测前者的均值。
它是处理变量之间相关关系的一种常用数学统计方法, 是最常用的数理统计方法,可以解决预测、控制、优化等问题。
它在工农业生产和医学研究及国民经济的各个领域都有广泛的应用。
回归分析种类包括线性回归分析和非线性回归分析。
非线性回归是回归函数关于未知参数具有非线性结构的回归,但某些非线性回归模型可以化为线性回归模型处理。
本文主要是运用多元线性回归的方法分析病人的血压、血糖、胆固醇甘油三酯进行相关分析,进而确定三者之间的函数关系。
回归分析是一种传统的应用性较强的学习方法,是现代应用统计学的一个重要的组成部分,在各个科学领域都得到了相应比较广泛的应用。
它不仅能够把隐藏在大规模原始数据群体中的重要信息挖掘出来,把握住数据在群体中的主要特征,从而得到变量间相关关系的数学表达式,利用数学概率统计知识对此关系进行分析,以此来判别其有效性,还可以利用关系式,由一个或多个变量值去预测和控制另一个因变量的取值情况,从而知道这种预测和控制所能够达到的程度,并进行因素的分析。
2相关定义2.1回归分析的基本定义通过利用这种统计关系在一定置信度下由各因素的取值去预测响应值的范围,在众多的预报变量中,判断哪些变量对自变量能够显著影响,哪些变量不能够显著影响;根据预报变量的给定值来估计和预测精度。
常用的回归模型主要包括线性回归、非线性回归,前者又可分为一元线性回归、多元线性回归,后者分为可化为一元线性方程的回归方程,如指数函数、对数函数等,及可化为多元线性方程的回归方程,如多项式方程。
传统的回归分析方法是对线性回归模型采用最小二乘法来拟合回归方程,然后计算相关系数进行显著性检验,而对于非线性方程,还要对自变量和因变量作适当的变换后,把非线性方程转化为线性方程,然后再用线性回归的方法处理非线性方程。
通过这种传统的回归计算方法,尤其对于多元非线性方程的计算,求解过程比较繁琐,计算过程复杂。
2.2多元回归分析定义在处理测量数据时,经常要研究变量与变量之间的关系。
变量之间的关系一般分为两种。
一种是完全确定关系,即函数关系;一种是相关关系,即变量之间既存在着密切联系,但又不能由一个或多个变量的值求出另一个变量的值。
回归分析的任务就是用数学表达式来描述相关变量之间的关系。
2.3多元回归分析的基本模型设123 x x x ..... x p是p 可以精确测量或可控制的变量。
如果变量y 与123x ,x ,x ..... ,x p之间的内在联系是线性的,那么进行n 次试验,则可得n 组数据:(123 x ,x ,x ..... ,x i i i ip), i= 1,2,…,n它们之间的关系可表示为:10111212p 1p 120121222p 2p 2n 01n12n2p np ny b b x b x b x y b b x b x b x .......y b b x b x b x εεε=+++⋯++=+++⋯++=+++⋯++其中,012,,....n b b b b 是p +l 个待估参数,i ε表示第i 次试验中的随机因素对i y的影响。
为简便起见,将此n 个方程表示成矩阵形式:Y XB ε=+其中12(,...,)n Y y y y T=01(,...,)p B b b b T= 12(,...,)Tn εεεε=上式便是p 元线性回归的数学模型。
2.3.1参数B 的最小M 乘估计为了求出多元线性回归模型中的参数01,...,pb b b ,可采用最小二乘法,即在其数学模型所属的函数类中找一个近似的函数,使得这个近似函数在已知的对应数据上尽可能和真实函数接近。
设012pc c c c ⋯,,,,分别是01,...,pb b b 的最小二乘估计,则多元回归方程(即近似函数)为:01112p py c c x c x c x =+++⋯+其中012pc c c c ⋯,,,,叫做回归方程的回归系数。
对每一组(i1i2ipx ,x ,,x ⋯),由回归方程可以确定一个回归值iy 。
这个回归值iy 与实际观测值iy 之差,反映了iy 与回归直线01112p py c c x c x c x =+++⋯+的偏离程度。
若对所有的观测数据,i y 与i y (I=1,2, …,n)的偏离越小,则认为回归直线与所有试验点拟合得越好。
全部观测值iy 与回归值iy 的偏差平方和为:()12201p i j 0122(c c c )(y y )...i n n i x i p ipiiQ y c c c x c x ⋯=-=-----∑∑,,,根据微分学中的极值原理012pc c c c ⋯,,,,应是下列方程组的解:通过整理可将上述方程组写成如下形式:()12012201i1p ip ...0(y-c -c x - -c x )0(1,2,...,)i ni x i p ip i ni y c c c x c x j p ⎧-----=⎪⎪⎨⎪=⋯==⎪⎩∑∑即011222011122122201122................................................nn n n ni i p ip iii i i in n n n ni i i i ip ip i i i i i i i n n n n nip i ip i ip p ip ip iii i i i c c x c x c x y c x c x c x x x x c x y c x c x x c x x c x x y ⎧+++++=⎪⎪⎪++++=⎪⎨+++++=⎩∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑⎪⎪⎪⎪上式也可以用矩阵表示为:()X'X C X'Y=其中012p c (c c c c )'=⋯,,,,,称为回归方程的系数矩阵,X'是X 的转置矩阵。
当X'X 满秩时,逆矩阵()1X 'X -存在,系数矩阵C 可以表示为:()1C X'X X'Y-=上式即为回归模型中参数B 的最小二乘估计。
至此,我们就得到了p 元线性回归方程。
建立回归方程的目的是要利用它来进行预报与控制。
在实际问题中,事先并不能断定随机变量y 与12px ,x ,,x ⋯之间确有线性关系,在求解回归方程前,线性回归模型只是一种假设,所以在求出线性回归方程之后,还需对其进行统计检验,给以肯定或否定的结论。