当前位置:文档之家› 研究工具的信度与效度08.4

研究工具的信度与效度08.4

用SPSS统计软件计算结果显示。
Item-total Statistics Scale Mean if Item Deleted X1 X2 X3 X4 6.1100 6.0500 6.1500 6.0700
Scale Variance if Item Deleted 1.6342 1.7247 1.7652 1.5405
同时效度(concurrent validity)
研究工具与现有标准之间的相关性
预测效度(predictive validity)
测量工具作为未来情况预测指标的有效程度。
检验方法:相关分析或差异显著性检验
效标关联效度测定
研究对象 1 2 3 4 5 6 7 8 9 10 护士专业水平 量表得分 25 30 17 20 22 27 29 19 28 15 发表论文篇数 2 4 0 1 0 2 5 1 3 1
Corrected ItemTotal Correlation .5198 .3307 .4470 .5587
Alpha if Item Deleted .6255 .6855 .6512 .6085
X5
X6 N of Cases = Alpha =
5.6500
6.1200 100.0
1.6439
1.6824
效度的相关问题
研究工具性能测定
学习目标:
1. 能说出信度、效度的概念 2. 能描述信度的三个特征 3. 能进行重测信度、内部一致性信度的计算 4. 能说出效度的类别 5. 能进行内容效度的计算 6. 能描述信度与效度的关系
(Reliability)
一、信度(reliability)概念 是指研究工具的可靠性和稳定性的程 度。或是指使用某研究工具所获得结 果的一致程度或准确程度。 包括三个主要特征: 稳定性、内部一致性和等同性
.2006
.4817 N of Items = 6
.7831
.6382
Reliability Coefficients
.6943
评定者间信度 (interrater reliability)
不同评定者使用相同的工具,同时测 量相同的对象时,需计算评定者间一 致程度。 检验方法:相关系数
复本信度
指两个大致相似的研究工具同时被用于 研究对象,需计算复本信度。 • 检验方法:相关系数

信度的大小由信度系数(r)来表
示。
信度水平的评价:
高水平:
r 〉0.75
中等水平:r= 0.5-0.75 低水平:
r〈 0.5
量表信度的影响因素
策略:- 增加条目数
删除低区分度的条目 删除低相关性的条目
量表条目数量、条目区分度和条目相关性
他评量表中各类别定义的准确性
策略:培训研究人员
效度
效度概念(validity)
指测量工具是否有效地测定到了
它所打算测定的内容或测定工具 的测定结果与预想结果的符合程 度。(某研究工具能真正反映它所
期望研究的概念的程度,即正确程 度。) 效度的大小由效度系数来表示。
效度的类型
表面效度(face validity) 内容效度(content validity) 效标关联效度(criterion- related validity) 结构效度(construct validity)
医生需求与去向 农村学历层次
调整前
0. 435 0. 317
调整后
0. 734 0. 734 0. 813
农村医学教育基本模式 0. 406
影响信度的因素
• 导致产生不一致的事件 1.被测者的实际特征发生了变化 2.随机变化 • 量表的设计 1.应答条目的级数(12%、35%) 2.条目的数量 3.条目的代表性 • 得分范围 • 样本容量
重测信度(test-retest reliability)
程 度。
指标: 重测相关系数(r)
r= 0- 1

r 越接近1,重测信度越高
人格问卷重测值
研究对象 1 2 3 4 5 6 7 8 9 10 第一次测试值 23 44 35 53 44 26 32 28 38 39 第二次测试值 27 38 37 49 46 28 34 25 34 36
2. 第一次测量结果的记忆效应
3. 被调查者对第二次测评的不认真
4. 条目设置问题
5. 答案的评分等级问题
※研究表明:采用同一份由204个
问题组成的自填式医学问卷,对 2352名病人进行两次调查,间隔 30分钟,发现仅20%的人对所有 问题两次回答一致,有5%的人对 13个及以上的问题两次回答不一 致。
人格问卷的折半情况
研究对象 1 2 3 4 5 6 7 8 9 10 总分 55 49 76 37 44 50 57 62 48 66 奇数项得分 28 26 34 18 23 30 30 33 23 28 偶数项得分 27 23 42 19 21 20 27 29 25 38
折半信度测定的缺点 • 不同的折半方法会导致不同的结
研究样本的异质性
-量表信度并非固定不变,
• 反向问题的处理:在调查问卷中出
现反向问题是问卷设计的实际需 要 。由于反向问题的计分是反序 的,所以需要调整成为正序。调不 调成正序对信度的影响十分大。以 克朗巴赫系数α为信度指标,下表 给出调整前后的α值的变化。
调整反向问题前后的α值的变化
模块问题数
目数占总条目数的百分比。
如:AB-0.8 AC-0.9 AD-0.85、AE-0.9、BC-0.7、
BD-0.8、BE-0.85、CD-0.7、CE-0.75、DE-0.75
计算所有组的平均值,得到CVI为0.8
3、效标效度
(criterion-related validity)
以一个公认有效的研究工具作为标准, 检验新工具与标准工具测定结果的相 关性。
社会心理学领域 相关领域的临床护理专家 护理教育专家
专家的资格要求:
1. 在本领域具有较高的学术水平
2.具有较高的教育背景 3.具有丰富的社会心理学知识 4.熟悉测量工具的发展与心理学 特征测定的方法 5.严谨求实的科学态度
内容效度的评价
主要通过专家对研究工具的内 容进行评价 检验方法:文字形式评价 内容效度指数CVI公式
使用重测信度需考虑的问题
1. 两次测量间隔时间 2. 研究工具所测量的变量性质 -适用较稳定的变量:人格特征、能力、生 活质量、某些生理指标。 3. 测量环境的一致 包括:物理环境、时间、测量程序与测试 者等 4.样本量:预计样本的10%(10-20例)
重测信度结果的影响原因
1. 变量随时间推移而发生改变

定义
- 指量表中条目反映所测量内容的程度。 - 即每个条目与所测内容的相关性,以及量表 中条目是否充分地反映了测量工具所测的领域。


适用:问卷或量表形式的研究工具
内容效度为专家对工具内容的合适性进行
判断,一般需3个以上专家。

建立的基础:
大量查阅文献 工作经验 综合分析、判断
评定方法:
专家组(expert panel)评定
效度可作为某行为、现象的预测指标。
4、结构效度(constructive
validity)
反映研究工具所依据理论的程度, 与理论框架相符合与否。用已 知的具体的概念反映抽象的概 念。 检验方法:因子分析

因子分析的主要功能是从量表全部变 量(题项)中提取一些公因子,各公 因子分别与某一群特定变量高度关联, 这些公因子即代表了量表的基本结构。 通过因子分析可以考察问卷是否能够 测量出研究者设计问卷时假设的某种 结构。在因子分析的结果中,用于评 价结构效度的主要指标有累积贡献率、 共同度和因子负荷。累积贡献率反映 公因子对量表或问卷的累积有效程度, 共同度反映由公因子解释原变量的有 效程度,因子负荷反映原变量与某个 公因子的相关程度。
克朗巴赫系数α(Cronbach α): 研究工具中所有项目的平均相关程度, 用SPSS统计软件计算。
计算方法:公式: α=Np/[1+p(N-1) SPSS软件
Spss 中Cronbach α的步骤
在任务栏中选Analyze scale reliability items alpha
Chronbach’s a相关系数
………………
问题的方
4、………….. 5、………….. 1 1 2 2 3 3 4 4
………………
………………
**根据修改意见修改后,间隔一定时间(10—14d)再次评议
5位专家两两配对成10组。
AB、AC、AD、AE、BC、BD、BE、CD、CE、DE
分别计算各组中两个专家都认为相关的条
r=0.83
同时效度举例
测评量表:健身锻炼自我效能量表 效标:个体是否进行每周3次的每次20分钟有氧锻炼 考察指标:两项结果的相关系数
预测效度举例
测评量表:青少年对婚前性生活的态度量表
效标:测评后2年间是否发生婚前性生活 考察指标:两者间相关性
若两者之间高相关,该量表具有很好的效标
( content validity index)
应对方式量表内容效度测定
完全 需修改 相关但 非常 修改意见
不相关 否则不相关 仍需改动 相关
1、通过抽烟、喝酒等方 式来解决烦恼 2、幻想可能会发生某种 奇迹改变现状 3、找出几个不同的解决 1 2 3 4 ……………… 1 2 3 4 ……………… 1 2 3 4
• 估量信度的方法有很多,只用一次测
验求出的信度系数反映的是测验的内 部一致性(比如二分法、折半法、克 朗巴赫系数α),用两次以上测验求 出的信度系数是对测验等值性或稳定 性的估量(比如复本信度,评定者间 信度,重测信度)。
相关主题