当前位置:文档之家› 广义线性混合效应模型及其应用

广义线性混合效应模型及其应用


从 结 果 看 到 , 考 虑 了 不 同 中 心 的 差 异 , A、B 两 种 药 物 的 副 作 用 的 发 生 有 差 异 ( β1 = - 0.9298, P = 0.0354, B 药 更 易 发 生 副 作 用 ) , 不 同 实 验 中 心 的 间 的 方 差 为 1.5809, P = 0.1842, 差异无统计学意义。
设随机效应 ui 的密度函数为: fu( ui, G) , 有边际似然函数:
& Li ! β, γ" = Li ! β, ui " fu ! ui, γ" dui ui
&#% $ ni

ui
fy ! yij ui,
j=1
Xij,
β"fu ! ui,
γ" dui
( 1.5)
γ是 Ui 的方差协方差矩阵, 是 G 的参数估计值。
得到似然函数:
% L! β, γ" = Li ! β, γ" ( 1.6) i
从上式可以看到, 计算似然函数比线性混合效应模型复杂
· 2104 ·
现代预防医学 2007 年第 34 卷第 11 期 Modern Preventive Medicine, 2007, Vol.34, NO.11
得 多 , 需 要 解 决 随 机 效 应 ui 的 高 维 积 分 的 问 题 , 许 多 最 大 化 似然函数的近似的推断方法被提出, 目前积分近似方法主要有 Laplace 近似 ( Liu and Pierce, 1993) , Adaptive Gaussian 积分, 一阶泰勒 ( first- order Taylor) 序列展开近似。 2 实例分析
为了研究 A、B 两种药物的的副作用情况 , 研 究 者 随 机 选 取 了 15 个 中 心 做 临 床 实 验 , 在 每 个 中 心 中 , 随 机 抽 取 一 定 数 量 的 病 人 , 其 中 nA 个 病 人 接 受 A 药 物 , nB 个 病 人 接 受 B 药 物。数据格式见表 1。
1 方法介绍 广义线性模型目前已在医学领域有广泛的应用, 但要求观
测之间互相独立, 在模型中增加随机效应项 ui: μij=E ! Yij ui, Xij " =ηij=X' ijβ+Z' ijui ( 1.1)
反应变量 Yij 的条件分布的期望: μij=E ! Yij ui, Xij " ( 1.2) 条件均数 μij ( 考虑了随机效应) 通过联结函数 g ( .) 与条件线 性预测值 ηij 联结,
g( μij) =ηij=X' ijβ+Z' ijui ( 1.3) 式 ( 1.3) 为广义线性混合模型的 一 般 式 , Yij: 第 i 类 的 第 j 个 观测的反应变量, i=1, ……, m, j=1, ……ni, 考虑随机效应 ui 的条件下独立, 服从指数分布族, 可以是二项分布、Poisson 分布、Gamma 分布等, 其密度函数为:
关键词: 广义线性混合效应模型; 最大似然估计; 随机效应
GENERALIZED LINEAR MIXED MODELS AND ITS APPLICATION LI Li- xia, GAO Yan- hui, ZHANG Pei - de, et al. ( Department of Medical Statistics, Guangdong College of Pharmacy, Guangzhou 510224, China)
Abstr act: [ Objective ] To explore the application of ceneralized linear mixed models in medical research. [ Methods ] How to fit a generalized linear mixed model for binomial data with the nlmixed procedure was demonstrated. [ Res ults ] In multi- center trials, we constructed ceneralized linear mixed models regarding center as random effect. [ Conclus ion] General- ized linear mixed model is an increasingly popular choice for the modelling of correlated data, non- normal response in a regres- sion setting.
βA, βB 为固定效应, ui 为第 i 个中心的随机效应, 则有:
! " log
πiA 1- πiA
=ηiA=β0+βA=ui
! " log
πiB 1- πiB
=ηiB=β0+βB=ui
采用 SAS 8.0 的 nlmixed 过程拟合模型, 程序如下:
data multicenter;
input center group¥ n x@@; datalines; ……;
研 究 者 随 机 选 取 了 15 个 中 心 做 临 床 实 验 , 病 人 来 自 不 同 的中心, 而可能每个中心的医疗条件, 服务质量, 医生的素质 等不同, 从而可能产生非药物作用所带来的差异, 我们尝试用
广 义 线 性 混 合 模 型 来 分 析 数 据 。 发 生 副 作 用 的 例 数 xij 服 从 二 项分布, 拟和含随机效应的 Logistic 回归模型:
proc nlmixed data=multicenter;
parms beta0=- 1 beta1=1 s2u=2; /* 定义参数及其初始值 * /
eta=beta0+beta1*group+u; expeta=exp( eta) ; p=expta /( 1+expeta) ;
model x ̄binomial ( n, p) ; /* 定义 x 的条件分布 * /
# $ fY! yij ui; φ" =exp yθa-! bφ! θ""+c ! y, φ"
作者简介: 李丽霞 ( 1974- ) , 女, 硕士, 研究方向: 统计学的教学 作者单位: 广东药学院预防医学系卫生统计教研室, 广州, 510224
其中, θ称为自然参数, ቤተ መጻሕፍቲ ባይዱ称为尺度参数。
Xij: 解释变量, β: 固定效应参数矢量, ui: 随机效应, 服 从均数为 0, 方差协方差矩阵为 γ的多变量正态分布, ui 解释 了由于不可测因子引起的类间的异质性和同一类内观测到的相
为了解决关于随机效应的高维积分问题, 其他许多近似方 法被选择, 例如 Penalized Quasi- Likelihood ( PQL, Breslow and Clayton 1993) , Marginal Quasi- Likelihood ( MQL) 等 , The % GLIMMIX macro ( Wolfinger&o’Connell, 1993) 使 用 限 制 性 伪 似 然 ( restricted pseudo—likelihood, REPL) 拟 合 广 义 线 性 模 型, 贝叶斯方法通过 Gibbs 抽样技术在后验分布中重复 抽 样 避

变量所不能解释的变异) , σu 反映了类间的异质性。
广义线性模型的参数估计与性能受到大家的关注, 由于模
型中因变量与自变量间的非线性关系与随机效应 ui 的存在, 模型的参数估计比较困难, 设第 i 类的似然函数为:
ni
% Li ! β, ui " =fy! yi ui, Xi, β" = fy! yij ui, Xij, β" ( 1.4) j=1
与边际模型 ( marginal models) 相比, 广义线性模型又称
为条件模型 ( conditional model) , 当 Z=1 时, ηij=X' ijβ+ui, 为最 简单的混合模型, 称为随机截距模型 ( random- intercept
model) , ui 代表了第 i 类对类内观测的影响 ( 可以观测到的协
现代预防医学 2007 年第 34 卷第 11 期 Modern Preventive Medicine, 2007, Vol.34, NO.11
文 章 编 号 : 1003- 8507( 2007) 11- 2103- 02
中 图 分 类 号 : R195.1
文献标识码: A
· 2103 · 【流 行 病 与 统 计 方 法 】
关, 不同类间的 ui 是相互独立的, Zij: 与随机效应相关的解释 变量。设计矩阵有两部分: 固定效应 X 与随机效应 Z。分析的
数据不同可以选择不同的联结函数 g ( .) , 可以拟合含随机效
应的 Logistic 回归, 含随机效应的 Poisson 回归, Probit 回归等
多种模型。
Key wor ds: Generalized linear mixed Models ; Maximum likelihood es timation; Random effect
在生物与医学领域中常常会遇到不独立的数据, 例如: 分 析家系资料中的的遗传、环境效应, 分析重复测量资料, 多中 心临床试验数据, 毒理学实验中的窝别效应等, 家庭、重复测 量中的不同个体、实验中心、窝别等都可以看作不同的类 ( cluster) , 研究总 体 中 有 许 多 类 , 同 一 类 中 的 观 测 相 关 , 而 经 典的回归模型要求观测间互相独立, 而线性混合效应模型要求 应变量是连续性变量, 不适合因变量为离散或计数的资料, 广 义 线 性 混 合 模 型 ( Generalized linear mixed models, GLMMs) 是 广 义 线 性 模 型 的 ( Generalized linear models, GLMs) 与 线 性 混 合 效 应 模 型 ( linear mixed model) 的 扩 展 , 通 过 在 模 型 中 纳 入随机效 应 来 解 释 数 据 间 的 相 关 , 过 度 离 散 ( overdispersion) 、 异质性 ( heterogeneity) 等问题。
相关主题