当前位置:文档之家› 多水平统计模型简介SPSS操作

多水平统计模型简介SPSS操作

1.正态性不满足
-数据变换,增加样本含量
2.方差非齐性
-增加协变量 -数据变换 -广义线性模型或非线性模型
3.独立性不满足
-S.E.的稳健估计 -GEE估计方法 -拟合非独立性来源的模型
Chongqing Medical University Peng Bin
非独立性来源
1.区域环境对反应变量的影响
还需估计三个随机参数
2 u0
u21和
。e20 其中
u2即0 为
学校水平的方差成份, 为e学20 生水平的方差成份。
1.模型中的参数估计值、标准误有偏差 2.残差方差偏大,即模型拟合优度差 3.损失高水平(如水平二:学校)对结果的影响信息
Chongqing Medical University Peng Bin
基本的多水平模型
• 经典模型的基本假定是单一水平和单一的随机 误差项,并假定随机误差项独立、服从方差为 常量的正态分布,代表不能用模型解释的残留 的随机成份
截距不同,斜率不同
yij 0 j 1 j xij eij
Chongqing Medical University Peng Bin
按学校绘制散点图及拟合线
该模型即为多水平模型
yij 0 j 1 j xij eij
Chongqing Medical University Peng Bin
0 j 00 u0 j
00 为平均截距,反映 yij 与 xij 的平均关系,
即当 x 取 0 时,所有 y 的总平均估计值。
u0 j 为随机变量,表示第 j 个学校 y 的平均估
计值与总均数的离差值,反映了第 j 个学校对 y 的 随机效应。
Chongqing Medical University Peng Bin
多水平模型基本结构
yij 0 j 1 j xij eij
0 j 00 u0 j 1 j 01 u1 j
x yij 和 ij 分别为第 j 个
学校中第 i 个学生应变量 观测值和解释变量观测值
00是
0
的平均值,为固定成分
j
,u0
j为0
的随机成分
j
,
服从正态分布
01是1
的平均值,为固定成分
1 j 01 u1 j
01 表示协变量 x 在所有学校的平均效应估计
值(固定部分),u1 j 表示协变量 x 在不同学校所
产生的特殊效应(随机部分),反映协变量与学 校之间产生的交互效应,即学校间 y 的变异与协 变量 x 的变化有关。
Chongqing Medical University Peng Bin
-卫生服务区域的资源、社会经济条件和政策会影响对病 人的服务质量
-高血压发病率可能有地区聚集性,取决于经济文化背景 和居民饮食习惯
2.重复测量结果通常具有强相关
-分子生物学研究中重复测量数据处理中的问题
3.区组设计和多中心试验
-卫生毒理实验研究中同窝动物的相似性 -同中心内病人病情、病种相似性
Chongqing Medical University Peng Bin
多水平模型简介
Multilevel Models
Chongqing Medical University Peng Bin
单水平模型
1,2,...,i,...n个观察对象
yi 0 1xi ei ,
ei
~
N
(0,
2 e
)
模型假设: 正态性、独立性、残差方差齐同性 协变量的影响保持不变
假设不满足时的处理
0 j 00 u0 j 1 j 01 u1 j
yij ( 00 u0 j ) ( 01 u1 j )xij eij ( 00 01xij ) (u0 j u1 j xij eij )
固定效应部分 随机效应部分(残差项)
Chongqing Medical University Peng Bin
例如,来自同一家庭的子女,其生理和心理 特征较从一般总体中随机抽取的个体趋向于更为 相似,即子女特征在家庭中具有相似性或聚集性 (clustering),数据是非独立的(non independent)。
Chongqing Medical University Peng Bin
忽略多水平层次结构的后果
层次结构数据的普遍性
家庭
学校
病人
水平2
水平1
子女
Байду номын сангаас
学生
测量1 测量2 测量3
两水平层次结构数据
两水平层次结构:水平1单位在水平2内聚集
层次结构数据为一种非独立数据,即某观察值 在观察单位间或同一观察单位的各次观察间不独 立 或 不 完 全 独 立 , 其 大 小 常 用 组 内 相 关 (intraclass correlation,ICC)度量。
yij ( 00 01xij ) (u0 j u1 j xij eij )
反应变量Y可表达为固定部分 ( 00 x 01 ij ) 与随机
部分 (u0 j u1 j xij ei之j ) 和。模型具有多个残差项,这是
多水平模型区别于经典模型的关键部分。
此模型需估计5个参数,除两个固定系数 00 和 01,
• 多水平模型将单一的随机误差项分解到与数据 层次结构相应的各水平上,具有多个随机误差 项并估计相应的残差方差及协方差。
• 构建与数据层次结构相适应的复杂误差结构, 是多水平模型区别于经典模型的根本特征
• 多水平模型由固定与随机两部分构成,其随机 部分可以包含解释变量
多水平模型基本结构
假定一个两水平的层次结构数据,学校为水平 2 单位,学生为水平 1 单位,学校为相应总体的 随机样本。
j
,u1
j
为1
的随机成分
j
,
服从正态分布
E(u0 j ) 0, E(u1 j ) 0, E(eij ) 0,
Var(u0
j
)
2 u0
Var(u1
j
)
2 u1
Var(eij
)
2 e0
Chongqing Medical University Peng Bin
多水平模型基本结构
yij 0 j 1 j xij eij
学校1
……
学校k
学生
学生 …… 学生
观测指标: X, Y
学生
普通线性回归,忽略学校
yi 0 1xi ei
Chongqing Medical University Peng Bin
按学校分别拟合
截距不同,斜率相同
yij 0 j 1xij eij
截距相同,斜率不同
yij 0 1 j xij eij
相关主题