信号检测论——评价法姓名(小组成员:)摘要:本实验选取了两名上师大心理系本科生,两名被试均为女性,采用了信号检测论的评价法考察了两名被试对汉字再认的准确性和判断标准。
实验发现:(1)信号检测论的评价法是一种进行记忆再认研究的有效工具;(2)在同一种判断标准下,被试二的击中率和虚报率均高于被试一;(3)在同一种判断标准下,被试一的判定标准β要大于被试二的,辨别力要小于被试二的。
关键词:信号检测论评价法;ROC曲线;辨别力d’;判定标准β1 导言信号检测论是现代心理物理学最重要的内容之一,它的出现彻底改变了以往人们对阈限的理解,将个体客观的感受性和主观的动机、反应偏好等加以区分,从而解决了传统心理物理学所无法解决的问题[1]。
信号检测论认为:被试觉察信号有一个中枢神经效应,这种效应随着每次剌激呈现,时刻都在变化。
信号总是在噪音的背景上产生,信号的影响和噪音的影响都被假定为正态分布,这两种分布由于信号比噪音微弱增强,故有一定的重叠,而使信号和噪音都可能引起同一程度的感觉。
人类觉察是建立在统计决策论的基础上。
就是说被试选择一个标准,当给定的刺激超过这个标准时,被试就反应“有”,否则则说“元”,而这个反应标准的选择由很多因索(如感受性、利益得失、动机、态度、情绪、意志等)决定。
这个反应标准就是阈限,而不是感觉本身的东西,它包括两个独立指标:一个是反应偏向,可用似然比值(B)或报告标准(C)来表示,它包括利益得失、动机、态度等因素;另一个是感觉辨别力指标(d’),表示感知能力。
信号检测论有三个基础的实验程序:有无法、迫选法和评价法。
评价法又称多重决策法,或评级量表法。
这一方法呈现刺激的方式同有无法一样,对信号和噪音的先验概率和奖惩办法,都可以随实验要求,由主试确定。
但对被试的要求有所不同,对被试的反应不是简单的“有”或”无”的方式,而是将被试从“有信号”到“无信号”这一感觉的连续体,规定出不同的感觉评价等级。
然后让被试根据对所呈现刺激的自信度情况,报告有信号(或元信号)的评定等级。
一般评价从有信号到无信号这一感觉连续体的等级可划分为六个;六个等级含义为:第一等级,非常肯定有信号出现;第二等级,一般肯定有信号出现;第三等级,可能有信号出现;第四等级,可能无信号出现;第五等级,一般肯定无信号出现:第六等级,非常肯定无信号出现[2]。
信号检测理论中的评价法在心理学实验中的应用是非常广泛的,如在研究“知道感”任务中的图片和字词的感受性和判断标准的实验中,该实验考察了在“知道感”(FOK)任务中的字词和图片的感受性和判断标准的差异。
实验运用Hart的“回忆一FOK判断一再认”(RIR)范式,用字词和图片作为刺激材料,采用两种不同的加工水平,并根据信号检测论中的评价法对结果进行分析。
结果表明,在知道感任务中,只有在线索回忆正确百分率和FOK判断等级上表现出了图片优势效应,而再认正确率和FOK准确性则没有图片优势;而且,不论是深加工还是浅加工,被试对字词和图片的感受性都没有显著性差异,但判断标准的变化较为复杂,且受加工水平的影响较大,显示出图片优势效应的产生与被试的反应偏向有关[3]。
又如在汉字再认能力心理指标d’与θ的比较中可以看出,信号检测论的评价法可以直接引进模糊数学集值统计的方法处理试验所采集到的数据,求出θ(平均置信度)。
θ与d’相比较,除了具有“灵敏度高、不受β影响的优点外,l) θ比d’意义更清晰、更明确,在某些特殊情况下,θ表征汉字再认能力似乎更接近被试实际再认能力;2) θ能够区别“击中”能方和“正确否定”能力;3)评价法的每一人次判断试验是集值统计试验,由于θ的计算原理不强求原始数据趋于正态分布,故可适当减少试验重复次数[4]。
在再认指标的探讨中,记忆研究的再认法传统上常用计算保持量作为再认的指标,而信号检测论则用计算辨别力指数d’作为再认的指标。
它们各有特点,又各有局限性。
本文从理论和实验上探讨了这些问题,并提出修正的计算方法,同时还分析了应用模糊集合统计处理信号检测论评价法的结果,计算再认程度函数作为再认的指标,比传统的指标及d’更具优越性:(1)比较符合心理判断的实际;(2)无须信号检测论的基本假设;(3)可排除判断标准的影响,有利于不同被试个体再认能力的比较[5]。
经过查阅前人的实验研究,我们发现信号检测论的评价法主要是应用于再认测验的研究。
我们本次实验的目的是通过比较被试对汉字再认的准确性和判断标准,学习用评价法进行信号检测论实验。
2 方法2.1被试:两名上师大心理系本科生,均为女性2.2仪器与材料2.2.1仪器:计算机及PsyTech心理实验系统软件2.2.2材料:信号汉字100个,噪音汉字100个2.3程序2.3.1登录并打开PsyTech心理实验软件主界面,选中实验列表中的“信号检测论(评价法)”。
双击呈现实验简介,点击“进入实验”到“操作向导”。
实验者可进行参数设置:改变刺激呈现时间等参数或默认参数。
点击“开始实验”呈现本实验指导语。
2.3.2第一次指导语是:这是一个用评价法进行的信号检测论实验。
实验开始后屏幕会逐个呈现一系列汉字,请你认真看并尽量记住这些汉字。
当你明白了上述指导语的意思后,就点击下面的“正式实验”按钮“开始”。
2.3.3被试按任意键后,实验先呈现100个作为信号的汉字,被试只看并记忆,不作其它反应。
呈现完毕,点“确定”再次出现指导语。
第二次指导语是:下面屏幕将再次逐个呈现一系列汉字。
其中一半是你刚才看过的,一半是没有看过的。
请你对这些呈现的汉字作出判断,是否你刚才看过的,并用鼠标对你判断的肯定程度作等级评价。
如果100%肯定看过,请点击“1”;如果觉得可能(75%肯定)看过,请点击“2”;如果觉得不能确定(50%肯定)看到过,请点击“3”;如果觉得可能(25%肯定)没看过,请点击“4”;如果100%肯定没有看过,请点击“5”。
当你明白了上述实验的步骤后,就请点击下面的“正式实验”按钮“开始”。
2.3.4将另外100个作为噪音的汉字与原来呈现过的汉字混合后再次随机呈现。
被试按照实验指导语要求对每个呈现的汉字作出是“信号”还是“噪音”的判断,并要求被试按五个等级评价。
2.3.5实验结束,点击结束提示语中的确定可直接查看结果,也可以换被试继续实验,以后在主界面“数据”菜单中查看。
2.4数据处理:采用了EXCEL 2003进行数据处理3 结果3.1计算两名被试五种评价等级下将刺激判断为信号和噪音的概率表1:被试一五种评价等级下对刺激的判断评判标准肯定看过可能看过不能确定可能没看过肯定没看过信号0.310.220.150.140.18噪音0.080.130.220.340.23被试一对判断为“肯定看过”的信号汉字的概率为0.31,噪音汉字的概率为0.08;被试一对判断为“可能看过”的信号汉字的概率为0.22,噪音汉字的概率为0.13;被试一对判断为“不能确定”的信号汉字的概率为0.15,噪音汉字的概率为0.22;被试一对判断为“可能没看过”的信号汉字的概率为0.14,噪音汉字的概率为0.34;被试一对判断为“肯定没看过”的信号汉字的概率为0.18,噪音汉字的概率为0.23。
表2:被试二五种评价等级下对刺激的判断评判标准肯定看过可能看过不能确定可能没看过肯定没看过信号0.560.280.050.070.04噪音0.170.260.120.350.10被试二对判断为“肯定看过”的信号汉字的概率为0.56,噪音汉字的概率为0.17;被试二对判断为“可能看过”的信号汉字的概率为0.28,噪音汉字的概率为0.26;被试二对判断为“不能确定”的信号汉字的概率为0.05,噪音汉字的概率为0.12;被试二对判断为“可能没看过”的信号汉字的概率为0.07,噪音汉字的概率为0.35;被试二对判断为“肯定没看过”的信号汉字的概率为0.04,噪音汉字的概率为0.10。
3.2计算两名被试四种判断标准下的击中率和虚报率表3:被试一四种判断标准下的击中率和虚报率判断标准C1 C2 C3 C4击中率0.31 0.53 0.68 0.82虚报率0.08 0.21 0.43 0.77被试一在判断标准一下的击中率为0.31,虚报率为0.08;在判断标准二下的击中率为0.53,虚报率为0.21;在判断标准三下的击中率为0.68,虚报率为0.43;在判断标准四下的击中率为0.82,虚报率为0.77。
表4:被试二四种判断标准下的击中率和虚报率判断标准C1 C2 C3 C4击中率0.56 0.84 0.89 0.96虚报率0.17 0.43 0.55 0.90被试二在判断标准一下的击中率为0.56,虚报率为0.17;在判断标准二下的击中率为0.84,虚报率为0.43;在判断标准三下的击中率为0.89,虚报率为0.55;在判断标准四下的击中率为0.96,虚报率为0.90。
3.3计算两名被试相应的辨别力d’和判定标准表5:被试一四种判断标准下的辨别力和判定标准判断标准C1 C2 C3 C4辨别力0.91 1.56 0.64 0.18判定标准 2.37 1.38 0.91 0.87被试一在判断标准一下的辨别力为0.91,判定标准为2.37;在判断标准二下的辨别力为1.56,判定标准为1.38;在判断标准三下的辨别力为0.64,判定标准为0.91;在判断标准四下的辨别力为0.18,判定标准为0.87。
表6:被试二四种判断标准下的辨别力和判定标准判断标准C1 C2 C3 C4辨别力 1.10 1.17 1.10 0.47判定标准 1.56 0.62 0.48 0.49被试二在判断标准一下的辨别力为1.10,判定标准为1.56;在判断标准二下的辨别力为1.17,判定标准为0.62;在判断标准三下的辨别力为1.10,判定标准为0.48;在判断标准四下的辨别力为0.47,判定标准为0.49。
3.4根据五个等级反应的次数,以评价等级数为横坐标,以次数为纵坐标,画出信号与噪音对比关系的直方图被试一对判断为“肯定看过”的信号汉字数量为31,噪音汉字的数量为8;被试一对判断为“可能看过”的信号汉字数量为22,噪音汉字的数量为13;被试一对判断为“不能确定”的信号汉字的数量为15,噪音汉字的数量为22;被试一对判断为“可能没看过”的信号汉字的数量为14,噪音汉字的数量为34;被试一对判断为“肯定没看过”的信号汉字的数量为18,噪音汉字的数量为23。
被试二对判断为“肯定看过”的信号汉字的数量为56,噪音汉字的数量为17;被试二对判断为“可能看过”的信号汉字的数量为28,噪音汉字的数量为26;被试二对判断为“不能确定”的信号汉字的数量为5,噪音汉字的数量为12;被试二对判断为“可能没看过”的信号汉字的数量为7,噪音汉字的数量为35;被试二对判断为“肯定没看过”的信号汉字的数量为4,噪音汉字的数量为10。