《应用统计分析》----题目2
题目2 数据data2是某医院3年中各月的数据,包括门诊人次、出院人数、病床利用率和周转次数、平均住院天数、治愈或好转率、病死率、诊断符合率、抢救成功率。
采用因子分析法探讨综合评价指标。
一、因子分析法
因子分析是主成分分析的推广和发展,也是利用降维方法进行统计分析的一种多元统计方法。
它是一种将多变量化简的技术,其目的是分解原始变量,从中归纳出潜在的“类别”,相关性较强的指标归为一类,不同类间变量的相关性则降低。
每一类变量代表了一个“共同因子”,即一种内在结构,因子分析就是要寻找该结构。
因子分析有一个默认的前提条件就是各变量间必须有相关性,否则,各变量间没有共享信息,就不应当有公因子需要提取,自然也谈不上使用该方法。
具体在该条件的判断上,除了根据专业知识来估计外,还可以使用KMO统计量和Bartlett’s 球形检验加以判定。
二、操作步骤
1.导入数据
依次单击“文件—打开—数据文件”命令,打开如图1所示的对话框。
图1 导入数据
2.因子分析
(1)依次单击“分析—降维—因子分析”命令,如图2所示。
打开图3所示的“因子分析”主对话框。
图2 因子分析菜单
(a )选入变量前
(b )选入变量后
图3 “因子分析”主对话框
(2)在图3(a )所示的对话框中选中左边的变量,单击
按钮,将其
选入到左边的列表框中(如图3a 所示)。
(3)单击“描述”按钮,弹出“因子分析:描述统计”对话框,如图4所示,在“统计量”选项组中选取“原始分析结果”;在“相关矩阵”中选取“系
数”和“KMO和Bartlett”。
设置完毕后,单击“继续”按钮,确认操作。
图4 “因子分析:描述”对话框
图5 “因子分析:抽取”对话框
(4)单击“抽取”按钮,得到如图5所示的“因子分析:抽取”对话框。
选择“方法”为“主成分”;在“分析”选项组选择“相关性矩阵”;在“输出”选项组选择“未旋转的因子解”和“碎石图”;在“提取”选项组中将“因子的固定数量:”设置为4;将“最大收敛性迭代次数:”设置为25.
(5)单击“旋转”按钮,得到如图6所示的“因子分析:旋转”对话框。
在“方法”选项组选择“最大四次方值法”;在“输出”选项组选择“旋转解”;将“最大收敛性迭代次数:”设置为25。
(6)单击“得分”按钮,得到如图7所示的“因子分析:得分”对话框。
选择“保存为新变量”和“显示因子得分系数矩阵”;在“方法”选项组选择“回归”。
最后,在“因子分析”主对话框(如图3所示)中,单击“确定”按钮,执行操作。
图6 “因子分析:旋转”对话框图7 “因子分析:因子得分”对话框
3.结果解释
(1)相关性分析
表1 相关矩阵
通过相关矩阵发现,大部分系数均超过0.3,另外通过Bartlett检验可以看出,应拒绝各变量独立的假设。
不过KMO统计量为0.490,小于0.7,说明变量间的信息重叠度可能不是特别的高,有可能做出的因子分析模型不是非常完善,不过值得尝试。
(2)主成分信息
表3 主成分信息
表1中的前三个主成分的特征值大于1,但是它们的累积贡献率仅为69.410%。
(3)变量的共同度
表4 变量的共同度
图8 碎石图
表2显示,每一个变量的公因子方差均在0.5以上,且大多数接近或超过0.7,这说明4个公因子能够较好地反映客观原变量的大部分信息。
另外,从碎石图可以看出因子1、2、3、4之间的连线比较陡峭,说明特征值的差值较大,前四个因子比较重要。
这和上表的结果是吻合的。
(4)旋转前的因子负荷矩阵(如表3所示)
表5 旋转前的因子负荷矩阵
根据0.5原则,因子1在多数原始变量上有较大的负荷,因子2在x1(门诊人次)、x3(病床利用率)和x4(病床周转数)变量上有较大负荷,因子3在x6(治愈好转率)、x7(病死率)变量上有较大的负荷,因子4在x2(出院人数)变量上有较大负荷。
因此说明,除可初步认定因子1反映综合情况、因子3反映医疗水平情况外,其他两个因子的意义不明显。
(5)正交旋转矩阵(如表4所示)
表6 正交旋转矩阵
这是通过四次方最大旋转得到的正交变换矩阵。
(6)旋转后的因子负荷矩阵(如表5所示)
表7 旋转后的因子负荷矩阵
结果显示,因子1支配的变量有x1(门诊人数)、x2(出院人数)、x5(平均住院天数)、x8(诊断符合率)和x9(抢救成功率),因子2支配的变量有x3(病床利用率)和x4(病床周转数),因子3支配的变量有x6(治愈好转率)和x7(病死率),因子4支配的变量有x1(门诊人数)和x2(出院人数)。
故可以认为,因子1反应医院医疗工作质量各方面的情况,称为综合因子,因子2反应病床利用情况,称为病床利用因子,因子3反应医疗水平,称为水平因子,因子4反应就诊病人数量,称为数量因子。
与旋转前的因子负荷矩阵相比较,说明该旋转对因子负荷起到了明显的分离作用,使各因子具有较明显的专业意义。
通过探索性因子分析,从这9个变量中找到了4个潜在因子,它们是:综合因子、病床利用因子、水平因子和数量因子,如下表所示。
因子高负荷指标因子名称
因子一x1(门诊人数)综合因子
x2(出院人数)
x5(平均住院天数)
x8(诊断符合率)
x9(抢救成功率)
因子二x3(病床利用率)病床利用因子
x4(病床周转数)
因子三x6(治愈好转率)水平因子x7(病死率)
因子四x1(门诊人数)数量因子x2(出院人数)
That’s all! Thank you!
Thanks for your attention!。