《多元统计分析》思考题答案记得老师课堂上说过考试内容不会超出这九道思考题, 如下九道题题目中有错误的或不清楚 的地方,欢迎大家指出、更改、补充。
1、 简述信度分析 答题提示:要答可靠度概念,可靠度度量,克朗巴哈 系数、拆半系数、单项与总体相 关系数、稀释相关系数等(至少要答四个系数,至少要给出两个指标的公式) 答:信度( Reliability )即可靠性,它是指采用同样的方法对同一对象重复测量时所得结果 的一致性程度。
信度指标多以相关系数表示, 大致可分为三类: 稳定系数 (跨时间的一致性) 等值系数(跨形式的一致性)和内在一致性系数(跨项目的一致性) 。
信度分析的方法主要 有以下四种:1)、重测信度法这一方法是用同样的问卷对同一组被调查者间隔一定时间重复施测, 计算两次施测结果 的相关系数。
重测信度属于稳定系数。
重测信度法特别适用于事实式问卷, 如果没有突发事 件导致被调查者的态度、 意见突变, 这种方法也适用于态度、 意见式问卷。
由于重测信度法 需要对同一样本试测两次, 被调查者容易受到各种事件、 活动和他人的影响, 而且间隔时间 长短也有一定限制,因此在实施中有一定困难。
2)、复本信度法 复本信度法是让同一组被调查者一次填答两份问卷复本,计算两个复本的相关系数。
复 本信度属于等值系数。
复本信度法要求两个复本除表述方式不同外,在内容、格式、难度和 对应题项的提问方向等方面要完全一致,而在实际调查中,很难使调查问卷达到这种要求, 因此采用这种方法者较少。
3)、折半信度法 折半信度法是将调查项目分为两半,计算两半得分的相关系数,进而估计整个量表的信 度。
折半信度属于内在一致性系数, 测量的是两半题项得分间的一致性。
这种方法一般不适 用于事实式问卷(如年龄与性别无法相比) ,常用于态度、意见式问卷的信度分析。
在问卷 调查中,态度测量最常见的形式是 5 级李克特( Likert )量表。
进行折半信度分析时,如果 量表中含有反意题项, 应先将反意题项的得分作逆向处理, 以保证各题项得分方向的一致性, 然后将全部题项按奇偶或前后分为尽可能相等的两半,计算二者的相关系数。
为了校正差异,两半测验的方差相等时,常运用斯皮尔曼 - 布朗公式( Spearman-BrownFormula ):rxx=2rhh/(1+rhh ) ,其中, rhh :两半测验的相关系数; rxx :估计或修正后的信度。
该公式可以估计增长或缩短一个测验对其信度系数的影响。
当两半测验的方差不同时, 应采 用卢伦公式( Rulon Formula )或弗拉纳根公式( Flanagan Formula )进行修正。
4)、α信度系数法Cronbach α信度系数是目前最常用的信度系数,其公式为:S i从公式中可以看出,α系数评价的是量表中各题项得分间的一致性,属于内在一致性系数。
其中, nn1 i1 S XSi 2 为每一项目的方差; S X 2 为测验总分方差。
这种方法适用于态度、意见式问卷(量表)的信度分析。
2、简述多元尺度分析在你工作中的应用答:多元尺度分析(Multi-dimension Analysis)是市场研究的一种有力手段,是市场调查、分析数据的统计方法之一。
它可以通过低维空间(通常是二维空间)展示多个研究对象(比如品牌)之间的联系,利用平面距离来反映研究对象之间的相似程度。
由于多维尺度分析法通常是基于研究对象之间的相似性(距离)的,只要获得了两个研究对象之间的距离矩阵,我们就可以通过相应统计软件做出他们的相似性知觉图。
在实际应用中,距离矩阵的获得主要有两种方法:一种是采用直接的相似性评价,先对所有评价对象进行两两组合,然后要求被访者对所有的这些组合间进行直接相似性评价,这种方法我们称之为直接评价法;另一种为间接评价法,由研究人员根据事先经验,找出影响人们评价研究对象相似性的主要属性,然后对每个研究对象,让被访者对这些属性进行逐一评价,最后将所有属性作为多维空间的坐标,通过距离变换计算对象之间的距离。
多维尺度分析的主要思路是利用对被访者对研究对象的分组,来反映被访者对研究对象相似性的感知,这种方法具有一定直观合理性。
在工作中,通过多维尺度分析,可以将消费者对商品相似性的判断产生一张能够看出这些商品间相关性的图形。
例如:有十个百货商场,让消费者排列出对这些百货商场两两间相似的感知程度,根据这些数据,用多维尺度分析,可以判断消费者认为哪些商场是相似的,从而可以判断竞争对手。
用于反映多个研究事物间相似(不相似)程度,通过适当的降维方法,将这种相似(不相似)程度在低维度空间中用点与点之间的距离表示出来,并有可能帮助识别那些影响事物间相似性的潜在因素。
这种方法在市场研究中应用得非常广泛。
3、简述两个变量之间的相关分析答题提示:答什么是相关,对连续型变量用相关系数,对离散型变量用质相关系数答:相关分析(correlation analysis ),研究随机变量之间的相关关系的一种统计方法。
相关关系是一种非确定性的关系。
相关性探讨的是两变量间相关情况的的大致趋势。
相关分析涉及两个变量:应变量和自变量。
应变量(response variable)是度量研究结果的变量;自变量是解释或影响反应变量的变量。
两变量数据相关检验的步骤:一、图示两变量数据以及各个统计数字;二、查看整体状态及数据的离散情况;三、如果有较稳定的关系,就用简单的数学模式描述该关系。
对连续型变量常用相关系数刻画两个变量之间的相关性,而对离散型变量则用质相关系数。
4、 聚类和判别分析的异同答:聚类分析是把研究目标分割成为具有相同属性的小的群体。
而对观测值聚类称为 Q 型聚类。
它们在数学上是无区别的。
离,把最近的聚在一起。
这里的距离含义很广,如欧氏距离、马氏距离等距离,相似系数也 可看作为距离。
判别分析的基本思路设有 G1、G2、⋯ GK 个总体,从不同的总体中抽出不同的根据样本→建立判别法则→判别新的样品属于哪一个总体。
判别法则也是不同的。
常用的判别方法有:距离判别、判别分析和聚类分析都是分类。
其主要不同点就是, 在聚类分析中一般人们事先并不知 道或一定要明确应该分成几类,完全根据数据来确定。
而在判别分析中,至少有一个已经 明确知道类别的“训练样本”, 利用这个数据, 就可以建立判别准则, 并通过预测变量来为 未知类别的观测值进行判别了。
可以先聚类以得知类型 , 再进行判别 .5、 因子分析和主成分分析的异同答:主成分分析和因子分析是多元统计方法中关系密切的两种方法, 应用范围十分广泛, 可 以解决经济、教育、科技、社会等领域中的综合评价问题。
主成分分析采用降维的思想,将 研究对象的多个相关变量 (指标) 综合为少数几个不相关的变量, 反映原变量提供的主要信 息。
因子分析是主成分分析的推广和发展, 它将具有错综复杂关系的变量综合为数量较少的 几个因子, 以再现原始变量与因子之间的相互关系, 同时根据不同因子还可以对变量进行分 类,它属于多元分析中处理降维的一种统计方法。
但是,在许多论文中用 SPSS 进行综合分 析时, 出现这两种方法运用混淆的错误。
比如,主成分分析中对变量进行了因子旋转, 因子 分析的公因子系数错误等问题。
本文就此对主成分分析和因子分析的异同进行比较,并在 SPSS 和 DPS 软件上如何实现给予说明。
一、主成分分析与因子分析的异同点两者的相同点: 1、思想一致:都是降维的思想; 2、应用范围一致:都要求变量之间具 有不完全的相关性; 3、数据处理过程一致:数据的无量纲化,求相关系数矩阵的特征值和 特征向量,通过累计贡献率确定主成分个数、因子个数; 4、合成方法一致:都没有考虑原 始变量之间的关系,直接用线性关系处理变量与主成分和因子之间的关系。
两者的不同点: 1、方差损失上:主成分解释了原始变量的全部方差,无方差损失;因 子模型中除了有公因子外还有特殊因子,公因子只解释了部分信息,有方差损失; 2、唯一性:主成分分析不存在因子旋转,主成分是唯一的;因子分析进行因子旋转,解不唯一;3、对变量的聚类称为 R 型聚类, 聚类的基本想法:根据某种距 当然, 根据不同的方法, 建立的 Fisher 判别、 Bayes 判别。
实际意义:主成分没有实际意义;公因子有实际意义; 4、应用:主成分侧重信息贡献、影 响力综合评价;因子分析侧重成因清晰性的综合评价。
4. 主成分分析中, 当给定的协方差矩阵或者相关矩阵的特征值是唯一的时候, 的主成分一般 是独特的;而因子分析中因子不是独特的,可以旋转得到不到的因子。
5. 在因子分析中,因子个数需要分析者指定( spss 根据一定的条件自动设定,只要是特征 值大于 1 的因子进入分析),而指定的因子数量不同而结果不同。
在主成分分析中, 成分的数量是一定的, 一般有几个变量就 有几个主成分。
和主成分分析相比, 由于因子分析可以使用旋转技术帮助解释因子, 在解释方面更加有优势。
大致说来, 当需要寻找潜在的因子, 并对这些因子进行解释的时候, 更加倾向于使用因子分 析,并且借助旋转技术帮助更好解释。
而如果想把现有的变量变成少数几个新的变量 (新的 变量几乎带有原来所有变量的信息) 来进入后续的分析, 则可以使用主成分分析。
当然,这 中情况也可以使用因子得分做到。
所以这中区分不是绝对的。
总得来说, 主成分分析主要是作为一种探索性的技术, 在分析者进行多元数据分析之前, 用 主成分分析来分析数据, 让自己对数据有一个大致的了解是非常重要的。
主成分分析一般很 少单独使用: a ,了解数据。
(screening the data ),b, 和 cluster analysis 一起使用, c ,和判别分析一起使用,比如当变量很多, 个案数不多,直接使用判别分析可能无解,这时候 可以使用主成份发对变量简化。
( reduce dimensionality ) d, 在多元回归中,主成分分析 可以帮助判断是否存在共线性(条件指数),还可以用来处理共线性。
在算法上, 主成分分析和因子分析很类似, 不过, 在因子分析中所采用的协方差矩阵的对角 元素不在是变量的方差, 而是和变量对应的共同度 (变量方差中被各因子所解释的部分。
)。
6、 系统聚类与 K-means 聚类的基本原理 答:系统聚类法基本原理和步骤为:1、先计算 n 个样本两两间的距离2、构造 n 个类,每个类只包含一个样本3、合并距离最近的两类为一新类4、计算新类与当前各类的距离1. 因子分析中是把变量表示成各因子的线性组合, 变量的线性组合。
2. 主成分分析的重点在于解释个变量的总方差, 协方差。