判别分析解明明
• 主要目的是识别一个个体所属的 类别。
统计分析、数据挖掘与商业智能应用研究小组
模型的假设
• 判别分析模型有如下的假设:
✓ 解释变量间不存在多重共线性。 ✓ 对于一个解释变量其均值和方差不相关。 ✓ 在不同组间两个变量的相关系数是不变的。 ✓ 每一个解释变量的值服从正态分布。
如果假设满足,尤其是在样本量比 较小的情况下,Clementine能给出 更好的结果。
统计分析、数据挖掘与商业智能应用研究小组
• 根据分析目的, 我们只选择 region, age, marital, address, income, ed, employ, retire, gender, reside 和 custcat这几 个变量。
统计分析、数据挖掘与商业智能应用研究小组
• 从模型选项
统计分析、数据挖掘与商业智能应用研究小组
• 由于custcat是我们要预测的变量,在方 向(direction)里我们选为输出(out)
统计分析、数据挖掘与商业智能应用研究小组
• 由于本案例 关注的是人 口统计学变 量,所以我 们增加一个 过滤(Filter) 节点,单击 Annotation s将其重命名。
统计分析、数据挖掘与商业智能应用研究小组
• 选择执行(Execute)后,在右上角点 Models,双击custat,在数据流区域变 出现改节点,双击改节点便可以查看结 果。
统计分析、数据挖掘与商业智能应用研究小组
• 这张表格 展示了逐 步判别中 每次进入 分析的变 量,可见 最后模型 只选择了3 个变量。
➢判别分析
—discriminant
报告人:解明明 指导教师:谢邦昌 日期:2007年11月
统计分析、数据挖掘与商业智能应用研究小组
主要内容
➢ 判别分析介绍 ➢ Fisher判别 ➢ Bayes判别 ➢ 逐步判别 ➢ 案例分析
统计分析、数据挖掘与商业智能应用研究小组
判别分析介绍
• 判别分析是指对分类因变量的建 模,依据是因变量与一个或多个 解释变量的关系。
统计分析、数据挖掘与商业智能应用研究小组
• 逐步判别可以自动帮我们选择变量。但 是如果我们对于数据有一定的经验知道 哪些变量是重要的,选择逐步判别就是 很不明智的,因为这样选出来的变量可 能除了统计意义外,没有任何的实际意 义。
统计分析、数据挖掘与商业智能应用研究小组
由右边第一张 表可见前两个 线性判别函数 可以解释大部 分的变异
统计分析、数据挖掘与商业智能应用研究小组
Fisher判别
Fisher判别的思 想是投影,将k
组p维数投影到 某一个方向,使 得他们的投影组 与组之间尽可能 的分开。
-4 -3 -2 -1 0 1 2 3
-4
-2
0
2
4
6
统计分析、数据挖掘与商业智能应用研究小组
Bayes判别
Bayes判别的统计思想是:假定对研究 的对象已有一定的认识,常用先验概率 分布来描述这种认识,然后我们取得一 个样本,用样本来修正已有的知识(先 验概率分布),得到后验概率分布,各 种统计推断都通过后验概率分布来进行。 将这种思想用于判别分析,就得到贝页 斯判别。
• 双击来源选项板(Sources)中的SPSS 节点,数据流区域即可出现SPSS节点。
统计分析、数据挖掘与商业智能应用研究小组
• 数据流区域(Stream canvas)中双击 SPSS节点,在Import File 中选择我们 所要分析的数据。
统计分析、数据挖掘与商业智能应用研究小组
•在 收 藏 夹 (Favorites) 选项板或字段 操作选项板 (Field ops) 中双击类型 (Type)节 点,来检查是 否所有的变量 的类型都被正 确的定义。
(Modeling)
加入判别分
析
(dicrimina
nt)的节点。
并
在
Annotation
s中改名为
“判别分
析”。
统计分析、数据挖掘与商业智能应用研究小组
• 在判别分析
中点模型键
(Model),
并在方法
(Method)
中选逐步判
别
(stepwise
)
。
统计分析、数据挖掘与商业智能应用研究小组
•在 专 家 (Expert) 键中,选 择Expert, 单击输出 (output ),选择 如左图所 示的选项。
第二张表是四 个组标准化后 均值的位置。
统计分析、数据挖掘与商业智能应用研究小组
• 右表为标 准化的典 型判别函 数的系数。
统计分析、数据挖掘与商业智能应用研究小组
• 右图是 输出的 领域图。 它给出 了预测 变量和 组别间 的关系。
统计分析、数据挖掘与商业智能应用研究小组
• 右图是 结果, 可见模 型要比 随便猜 的结果 好。
统计分析、数据挖掘与商业智能应用研究小组
案例分析
• 假设有一个电信供应商已经根据客户业 务的使用情况将他们分为了四个组别。 如果人口统计学数据可以用来预测客户 的组别的话,我们就可以为潜在的客户 定制用户化的服务。
统计分析、数据挖掘与商业智能应用研究小组
• 这四个组别分别为:
统计分析、数据挖掘与商业智能应用研究小组
统计分析、数据挖掘与商业智能应用研究小组
• 参考文献 • Clementine 帮助 • 多元统计分析 何晓群 中国人民大学出版
社
统计分析、数据挖掘与商业智能应用研究小组