5 管理研究的效度与信度
所有构成指标都必须出现,每一个指标对于估计构念的真实分
数都是不可或缺的。
组成构念度量值的成分
• 在构念界定清楚的前提下,用操作变量对构念进行度量的
• • • •
•
• •
•
结果一般由三部分组成: (1)希望反映的目标构念的内容(真实值); (2)不希望反映的非目标构念的内容(系统误差); (3)随机误差。 即: X0=XT+XS+XR X0为测量值; XT为真实值; XS为系统误差; XR为随机误差。
准确带来的偏差。
• 例:组织承诺构念的操作性定义包含三个成分:对组织目
标和价值观的接受、愿意为企业的发展努力工作、希望保 留组织的成员身份。第三个成分与离职倾向构念高度相关, 这样在测量组织承诺时,同时包含了离职倾向的内容,造 成了测量上的混淆。
构念效度及其影响因素
理想测量成分
缺陷:操作中没 有被测量到的成分
免系统误差。此时不包括可靠性(信度)。
• 有效性以可靠性为前提,没有可靠性就没有有效性。在假
定度量具有高可靠性的前提下,概念建构有效性主要取决 于系统误差XS。
构念效度
• 影响构念效度的两类情况:缺陷(系统误差)与污染
(系统误差与随机误差)。
• 缺陷:实际测量中没有包含构念应该测量的成分,即操
作性定义没有充分地反映目标构念,是有“缺陷”的。
指标(负向载荷、最大载荷没有落在所测量的因素上) • 对于反映指标:重点在于考察共同变异(相关性)。 • 对于构成指标:重点在于估计指标的权重。
聚合效度与区分效度
• 聚合效度(Convergent Validity):应用不同方法测量同一
构念时,观测数值之间应高度相关。 • 区分效度(Discriminant Validity):应用不同方法测量不同 构念时,观测数值之间应能够加以区分。 • 多特质—多方法(multi-traits multi-methods, MTMM )模式 :用不同的方法(自评法-同伴评分法,调查法-观察法)同 时测量两个或两个以上的特质(构念)。
理论构念与测量指标
例:MacCallum和Browne(1993)认为一个人的收入和教育水
平并不是其社会经济水平的反映或结果。相反,是收入和教育 水平决定了一个人的社会经济地位。 收入水平(x1)、教育水平(x2)社会经济地位(X) X=γ1x1 + γ2x2 +ɛ γ1是收入水平影响社会经济地位的权重 γ2是教育水平影响社会经济地位的权重 ɛ是随机测量误差 E(γ1x1+ɛ )=γ1E(x1)+E(ɛ)=γ1E(x1)≠X
操作、测量
X
误差
因果关系
统计效度 共变关系\相关关系 特定时间、背景、对 象群体
Y
操作、测量 误差
理论构念与测量指标
• 测量指标一般分为两类:反映指标(效果指标)与构成指
标(原因指标)。 • 反映指标(reflective indicator)或效果指标(effect indicator ): 测量指标仅作为构念外在的表现形式; 这类测量指标反映了一个共同的理论构念,每个指标可以 无偏的代表这个构念。指标之间共同变异(协方差、相关 系数)较大,指标之间高度一致,可互换、可替代、可增 删,运用多指标仅为了增加信度; 研究中使用的指标大都是反映指标。
(遗传算法) • 竞争:新理论与原有理论针锋相对(Meindl,1990,1995, 魅力领导理论) • 整合:两个或两个以上理论基础上创建一个新的理论模型
理论描述
• 讲述一个有趣的故事:Cachon,2005
• 引用参考文献: 独立思考,建立有新的价值的理论模型
首选引用与作者观点关系密切、令人信服、简洁的文献
用来对理论加以检验的。系统观测总是由一个问题或假设 引发,而研究又导致对假设或理论的修正。可以说,理想 的科学之路是循环于理论与观测之间的。
什么是管理研究的有效性
• 管理研究中,有效性(Validity)是被普遍接受的评价研究
的指标。这种评价与其说是对方法本身的优劣进行评价, 不如说是对研究方法选择与应用是否适当进行评价。
• 因此我们还要考虑结构效度、聚合效度与区分效度的影响
。
构念效度
• 结构效度(structure Validity):同一个构念下的测量指标
必须反映同一个构念,即测量指标应是单一维度的。 • 聚合效度(Convergent Validity):应用不同方法测量同一 构念时,观测数值之间应高度相关。 • 区分效度(Discriminant Validity):应用不同方法测量不同 构念时,观测数值之间应能够加以区分。 • 广义的构念效度还包括可靠性(Reliability),即信度。
• 应用不同方法测量同一特质(构念)时,观测数值之间应
高度相关,聚合效度较高。同时,当该相关系数高于应用 不同方法测量不同特质(构念)得到的相关系数时,则认 为特质(构念)之间是可以区分的,区分效度较高。
聚合效度与区分效度
• 例:Lae, Wong和Song(2003)采用MTMM方法检验他们开
其次可考虑经典、权威、高等级期刊、投稿目标期刊文献 • 命题与联系:概念框架、分类、数据并不构成理论 ,构念
与构念的联系、假设与假设的联系 • 推理与原因解释 :是什么与为什么 • 框图 • 结束并继续故事
第五章 管理研究的效度与信度
社会科学研究与常识获取的区别
• 社会科学研究与为获得常识所做的日常观察之间最主要的
建构理论的方法
• 理论的社会建构:向学术同行寻求建议反馈以及研究者之
间的思想刺激。文献回顾、参加学术会议等学术活动。
• 发现并选择有意义的研究问题:真实性(外部)、有趣性
(内部)。 • 理论的发展方法:深化、繁衍、竞争、整合 • 深化:增加调节变量、中介变量
• 繁衍:将其他领域或学科的理论应用到一个新领域中。
内容效度
• 测量3个构念、4个指标的里克特量表 • 构念1: 指标1在多大程度上反映了构念1:1(完全没有反映)、2
、3、4、5(完全反映) 指标2在多大程度上反映了构念1:1、2、3、4、5 指标3在多大程度上反映了构念1:1、2、3、4、5 指标4在多大程度上反映了构念1:1、2、3、4、5 • 构念2: 指标1在多大程度上反映了构念2:1、2、3、4、5 …… 指标4在多大程度上反映了构念2:1、2、3、4、5 • 构念3: ……
效度与信度的关系
• 对构念度量有效性(效度)的评价包括了两个部分:XR和XS
。与XR有关的部分称为可靠性(Reliability,又称信度), 指在何种程度上度量避免了随机误差。 能代表要研究的构念。本身包括可靠性,即信度。
• 广义的构念效度是指操作化定义或测试的结果多大程度上 • 狭义的有效性(构念效度)是指测试结果多大程度上能避
• 任何理论都是由对有关构念、构念间关系的描述组成,并
有其特定的理论背景和应用范围。因此对管理研究的评价, 就集中在对有关构念及构念间关系研究的评价上,同时考 察理论的背景和应用范围。
研究效度(Validity)的类别
• 构念效度(Construct Validity,简称CV):是指理论中的抽
象构念在多大程度上在实际研究中成功地进行了操作化, 即操作变量在何种程度上体现了它想要体现的理论构念的 真正含义。即构念的定义与测量之间的一致程度。 • 内部效度(Internal Validity,简称IV):是指在多大程度上 研究允许得出两个变量之间是因果关系的推断。 • 外部效度(External Validity,简称EV):是指在多大程度 上可以将对特定研究样本和在特定研究环境下所得到的研 究结果推广到理论假设中所明确的总体和环境中去,因而 又可称为可推广性(generalibility)。
会将所有的测量指标一起进行因子分析(因子分析是用少 数几个可观测随机变量描述不可观测的假设变量之间的协 方差关系的数学方法),再由得到的因子载荷值来判断结 构效度的好坏。 • 若测量同一维度的指标因子载荷值越大(通常需要高于0.4 ),同时在其他维度上的因子载荷越小,则表示该测量的 结构效度较高。
• 可以剔除因子载荷非常低的无关指标,不符合研究预期的
研究效度(Validity)的类别
• 还有一种分类法是把效度分为四种,即:构念效度,统计
效度,内部效度和外部效度。 • 统计效度(Statistical Conclusion Validity,简称SCV)是指关 于变量之间相关变化的统计推论在何种程度上得到证实。 内部效度则定义为:观察到的相关变化在何种程度上可被 认为是因果关系。
内容效度
• 构念界定:解释差异、确定层次、明确内部成分、说明因
果关系 • 测量指标的产生:
归纳法(关键事件法、小组面谈发法、个人面谈法、开放
式问卷法、二手资料法)和演绎法 发展出足够多的测量指标,足以涵盖构念的理论边界。 • 内容效度评价:通过指标评价提高内容效度。 • 评价方法: 选择被试 被试阅读构念定义与测量指标 逐一评价匹配关系 通过统计分析评价内容效度。
• 例:中国组织公民行为构念,人际和谐指标,国外量表
与中国情境。
构念效度
• 污染:在实际测量中包含了构念并没有定义的成分,称这
一测量受到了“污染”。 • 污染一般来自两种可能:
测量中的随机误差变异:随机误差越大、信度越低,实际
测量结果越不可靠。
测量包含了除目标构念之外的系统性变异:操作性定义不
• 构念之间的关系可以表现为相关关系和因果关系,相关关
系是因果关系的必要条件。这种分类方法是把前一种分类 法中内部效度的内容分成统计结论有效性和内部有效性两 个层次。
ห้องสมุดไป่ตู้
研究中的效度(Validity)理念
其他时间、背景、对 象群体 外部效度 构 念 层 构念效度
X
操作化