混合效应线性模型与单因素方差分析在重复测量数据中的应用比较(一)
【关键词】重复测量;混合效应线性模型;单因素方差分析;
摘要:目的:通过混合效应线性模型与单因素方差分析在重复测量资料中的应用比较,旨在说明两方法在处理重复测量资料时的应用特点。
方法:用混合效应线性模型和单因素方差分析处理重复测量资料并比较。
结果:混合效应线性模型和单因素方差分析都是处理重复测量资料的重要统计方法,前者在选择协方差结构下可对重复测量资料的固定效应和随机效应参数及协方差矩阵进行参数估计和统计检验,后者可对重复测量资料的固定效应做出统计推断。
结论:混合效应线性模型是处理重复测量资料的有力方法,它对资料的协方差结构要求宽松,且结论可靠;单因素方差分析对资料的协方差结构有严格的限定。
关键词:重复测量;混合效应线性模型;单因素方差分析;
统计方法特点重复测量数据(repeatedmeasuresdata)是医学领域中常见的一种数据资料。
所谓重复测量是指对同一个观察对象在不同时间点上进行的多次测量〔1〕。
由于重复测量资料是对同一受试对象的某一观察指标进行的重复观察所得的数据,同一受试者的观察数据间可能存在相关性,一些传统的统计学方法如t检验等就不能充分揭示这一内在特点,有时甚至会导致错误的结论。
对重复测量资料的分析方法大致可分为两类,即单变量统计分析方法和多变量统计分析方法〔2〕。
本研究通过选用多变量统计分析方法中的混合线性效应模型对一例题的分析,并与单因素方差分析进行比较,来说明两种方法在处理重复测量资料中的应用特点。
1方法简介
简单说,混合效应线性模型就是所拟和的模型中既包含固定效应又包含随机效应,特别是个体内的数据结构的选择将对各因素的评价产生直接影响〔3〕。
混合效应线性模型是一般线性模型的扩展,其表达式为:
Y=Xβ+Zγ+ε(1)
X为已知设计矩阵,β为固定效应参数构成的未知向量,ε是未知的随机误差向量,其元素不必为同独立分布了。
在式(1)中Y,γ都是正态随机向量,其均值为0,方差阵分别为G 与R,二者之间不相关,因此Y的方差表达式为:
V=ZGZ+R(2)
当R=σ2I,Z=0时,混合线性模型退化为一般线性模型。
对G和R必须选择其协方差结构,常用的结构有无结构(一般为协方差)、自回归(常用一阶)、复合对称(共同协方差加一对角元)等〔4〕。
选择协方差矩阵的方法是在相同的结构模型下,选择几个不同结构的协方差矩阵,从中选取似然比统计量(-2LogLikelihood)、Akaikes信息量标准(AkaikesInformationCriterion,AIC)及SchwartsBayesian标准(SchwartsBayesianCriterion,BIC)较小的一个,当这些统计量较接近时,则选取含参数个数最少的一个。
通常以AIC为主要判断指标。
2实例分析
下面用一实例比较两种方法对处理重复测量资料时的特点:某药有新旧两种剂型,为了比较这两种剂型的代谢情况,对16例病人服药后分别在0、4、8、12小时测得血药浓度(表1),问该药新旧剂型的血药浓度随时间变化的趋势是否一致。
表1四个时间点某药新旧剂型血药浓度1用SAS软件的MIXED过程对固定效应和随机效应参数β、γ及协方差矩阵G、R进行估计和统计检验。
在本例中因变量为血药浓度,药物剂型、测量时间为固定效应,受试者为随机效应,同时选择合适的协方差结构以便在控制随机误差的基础上分析处理因素(药物剂型)对反应变量(血药浓度)的关系。
本例指定为常用的无结构协方差(UN)和复合对称性协方差(CS)。
模型拟合情况见表2。
表2模型配合统计量由表2可见,在UN结构下协方差配合的似然比统计量-2LogLikelihood=398.0(表2),对无效模型的似然比检验,χ2=134.43,ν=9,P<0.0001,
说明模型拟合效果显著,模型较好地拟和了资料。
在CS结构下,似然比统计量-2LogLikelihood=506.4,AIC、AICC、BIC三个值都是UN模型小于CS模型,故本例选用UN 结构作模型拟合。
在UN结构下的固定效应参数估计值及假设检验结果见表3、4。
由表4可知,在UN结构下,不同处理组之间的差别无统计学意义(P=0.07551),不同测量时间点的血药浓度及处理组×时间点的交互作用的差别有统计学意义(P<0.0001),且这种交互作用主要体现在新剂型组。
22应用SAS软件的GLM过程,对表1的资料处理结果见表5。
由表5可见,各处理组间时间因素间无差别,服从精确F分布,本例F处理组=0.09,P=0.77可见其处理组主效应与时间因素无关。