当前位置：文档之家› 5 管理研究的效度与信度

5 管理研究的效度与信度

所有构成指标都必须出现，每一个指标对于估计构念的真实分
数都是不可或缺的。
组成构念度量值的成分
• 在构念界定清楚的前提下，用操作变量对构念进行度量的
• • • •
•
• •
•
结果一般由三部分组成：（1）希望反映的目标构念的内容（真实值）；（2）不希望反映的非目标构念的内容（系统误差）；（3）随机误差。即： X0＝XT＋XS＋XR X0为测量值； XT为真实值； XS为系统误差； XR为随机误差。
准确带来的偏差。
• 例：组织承诺构念的操作性定义包含三个成分：对组织目
标和价值观的接受、愿意为企业的发展努力工作、希望保留组织的成员身份。第三个成分与离职倾向构念高度相关，这样在测量组织承诺时，同时包含了离职倾向的内容，造成了测量上的混淆。
构念效度及其影响因素
理想测量成分
缺陷：操作中没有被测量到的成分
免系统误差。此时不包括可靠性（信度）。
• 有效性以可靠性为前提，没有可靠性就没有有效性。在假
定度量具有高可靠性的前提下，概念建构有效性主要取决于系统误差XS。
构念效度
• 影响构念效度的两类情况：缺陷（系统误差）与污染
（系统误差与随机误差）。
• 缺陷：实际测量中没有包含构念应该测量的成分，即操
作性定义没有充分地反映目标构念，是有“缺陷”的。
指标（负向载荷、最大载荷没有落在所测量的因素上） • 对于反映指标：重点在于考察共同变异（相关性）。 • 对于构成指标：重点在于估计指标的权重。
聚合效度与区分效度
• 聚合效度（Convergent Validity）：应用不同方法测量同一
构念时，观测数值之间应高度相关。 • 区分效度（Discriminant Validity）：应用不同方法测量不同构念时，观测数值之间应能够加以区分。 • 多特质—多方法（multi-traits multi-methods, MTMM ）模式：用不同的方法（自评法-同伴评分法，调查法-观察法）同时测量两个或两个以上的特质（构念）。
理论构念与测量指标
例：MacCallum和Browne（1993）认为一个人的收入和教育水
平并不是其社会经济水平的反映或结果。相反，是收入和教育水平决定了一个人的社会经济地位。收入水平（x1）、教育水平（x2）社会经济地位（X） X=γ1x1 + γ2x2 +ɛ γ1是收入水平影响社会经济地位的权重 γ2是教育水平影响社会经济地位的权重 ɛ是随机测量误差 E(γ1x1+ɛ )=γ1E(x1)+E(ɛ)=γ1E(x1)≠X
操作、测量
X
误差
因果关系
统计效度共变关系\相关关系特定时间、背景、对象群体
Y
操作、测量误差
理论构念与测量指标
• 测量指标一般分为两类：反映指标（效果指标）与构成指
标（原因指标）。 • 反映指标（reflective indicator）或效果指标（effect indicator ）：测量指标仅作为构念外在的表现形式；这类测量指标反映了一个共同的理论构念，每个指标可以无偏的代表这个构念。指标之间共同变异（协方差、相关系数）较大，指标之间高度一致，可互换、可替代、可增删，运用多指标仅为了增加信度；研究中使用的指标大都是反映指标。
（遗传算法） • 竞争：新理论与原有理论针锋相对（Meindl，1990，1995，魅力领导理论） • 整合：两个或两个以上理论基础上创建一个新的理论模型
理论描述
• 讲述一个有趣的故事：Cachon，2005
• 引用参考文献：独立思考，建立有新的价值的理论模型
首选引用与作者观点关系密切、令人信服、简洁的文献
用来对理论加以检验的。系统观测总是由一个问题或假设引发，而研究又导致对假设或理论的修正。可以说，理想的科学之路是循环于理论与观测之间的。
什么是管理研究的有效性
• 管理研究中，有效性（Validity）是被普遍接受的评价研究
的指标。这种评价与其说是对方法本身的优劣进行评价，不如说是对研究方法选择与应用是否适当进行评价。
• 因此我们还要考虑结构效度、聚合效度与区分效度的影响
。
构念效度
• 结构效度（structure Validity）：同一个构念下的测量指标
必须反映同一个构念，即测量指标应是单一维度的。 • 聚合效度（Convergent Validity）：应用不同方法测量同一构念时，观测数值之间应高度相关。 • 区分效度（Discriminant Validity）：应用不同方法测量不同构念时，观测数值之间应能够加以区分。 • 广义的构念效度还包括可靠性(Reliability)，即信度。
• 应用不同方法测量同一特质（构念）时，观测数值之间应
高度相关，聚合效度较高。同时，当该相关系数高于应用不同方法测量不同特质（构念）得到的相关系数时，则认为特质（构念）之间是可以区分的，区分效度较高。
聚合效度与区分效度
• 例：Lae, Wong和Song（2003）采用MTMM方法检验他们开
其次可考虑经典、权威、高等级期刊、投稿目标期刊文献 • 命题与联系：概念框架、分类、数据并不构成理论，构念
与构念的联系、假设与假设的联系 • 推理与原因解释：是什么与为什么 • 框图 • 结束并继续故事
第五章管理研究的效度与信度
社会科学研究与常识获取的区别
• 社会科学研究与为获得常识所做的日常观察之间最主要的
建构理论的方法
• 理论的社会建构：向学术同行寻求建议反馈以及研究者之
间的思想刺激。文献回顾、参加学术会议等学术活动。
• 发现并选择有意义的研究问题：真实性（外部）、有趣性
（内部）。 • 理论的发展方法：深化、繁衍、竞争、整合 • 深化：增加调节变量、中介变量
• 繁衍：将其他领域或学科的理论应用到一个新领域中。
内容效度
• 测量3个构念、4个指标的里克特量表 • 构念1：指标1在多大程度上反映了构念1：1（完全没有反映）、2
、3、4、5（完全反映）指标2在多大程度上反映了构念1：1、2、3、4、5 指标3在多大程度上反映了构念1：1、2、3、4、5 指标4在多大程度上反映了构念1：1、2、3、4、5 • 构念2：指标1在多大程度上反映了构念2：1、2、3、4、5 …… 指标4在多大程度上反映了构念2：1、2、3、4、5 • 构念3： ……
效度与信度的关系
• 对构念度量有效性（效度）的评价包括了两个部分：XR和XS
。与XR有关的部分称为可靠性（Reliability，又称信度），指在何种程度上度量避免了随机误差。能代表要研究的构念。本身包括可靠性，即信度。
• 广义的构念效度是指操作化定义或测试的结果多大程度上 • 狭义的有效性（构念效度）是指测试结果多大程度上能避
• 任何理论都是由对有关构念、构念间关系的描述组成，并
有其特定的理论背景和应用范围。因此对管理研究的评价，就集中在对有关构念及构念间关系研究的评价上，同时考察理论的背景和应用范围。
研究效度（Validity）的类别
• 构念效度（Construct Validity，简称CV）：是指理论中的抽
象构念在多大程度上在实际研究中成功地进行了操作化，即操作变量在何种程度上体现了它想要体现的理论构念的真正含义。即构念的定义与测量之间的一致程度。 • 内部效度（Internal Validity，简称IV）：是指在多大程度上研究允许得出两个变量之间是因果关系的推断。 • 外部效度（External Validity，简称EV）：是指在多大程度上可以将对特定研究样本和在特定研究环境下所得到的研究结果推广到理论假设中所明确的总体和环境中去，因而又可称为可推广性（generalibility）。
会将所有的测量指标一起进行因子分析（因子分析是用少数几个可观测随机变量描述不可观测的假设变量之间的协方差关系的数学方法），再由得到的因子载荷值来判断结构效度的好坏。 • 若测量同一维度的指标因子载荷值越大（通常需要高于0.4 ），同时在其他维度上的因子载荷越小，则表示该测量的结构效度较高。
• 可以剔除因子载荷非常低的无关指标，不符合研究预期的
研究效度（Validity）的类别
• 还有一种分类法是把效度分为四种，即：构念效度，统计
效度，内部效度和外部效度。 • 统计效度（Statistical Conclusion Validity,简称SCV）是指关于变量之间相关变化的统计推论在何种程度上得到证实。内部效度则定义为：观察到的相关变化在何种程度上可被认为是因果关系。
内容效度
• 构念界定：解释差异、确定层次、明确内部成分、说明因
果关系 • 测量指标的产生：
归纳法（关键事件法、小组面谈发法、个人面谈法、开放
式问卷法、二手资料法）和演绎法发展出足够多的测量指标，足以涵盖构念的理论边界。 • 内容效度评价：通过指标评价提高内容效度。 • 评价方法：选择被试被试阅读构念定义与测量指标逐一评价匹配关系通过统计分析评价内容效度。
• 例：中国组织公民行为构念，人际和谐指标，国外量表
与中国情境。
构念效度
• 污染：在实际测量中包含了构念并没有定义的成分，称这
一测量受到了“污染”。 • 污染一般来自两种可能：
测量中的随机误差变异：随机误差越大、信度越低，实际
测量结果越不可靠。
测量包含了除目标构念之外的系统性变异：操作性定义不
• 构念之间的关系可以表现为相关关系和因果关系，相关关
系是因果关系的必要条件。这种分类方法是把前一种分类法中内部效度的内容分成统计结论有效性和内部有效性两个层次。
ห้องสมุดไป่ตู้
研究中的效度（Validity）理念
其他时间、背景、对象群体外部效度构念层构念效度
X
操作化

e商务文档

5 管理研究的效度与信度

相关文档推荐：