当前位置:文档之家› Skinner操作性条件作用理论简述

Skinner操作性条件作用理论简述

Skinner操作性条件作用理论简述王国胜,201511140243Skinner系统化发展了Thorndike的操作性条件作用理论,通过实验研究了强化的机制、原则、类型和方式,提出了操作性条件作用学习理论和程序教学的思想。

1操作性条件作用行为分类:•应答性行为:由已知刺激引起,有机体被动地对环境刺激做出反应。

•操作性行为:有机体的自发行为受强化后得到的在特定环境中随意或有目的的操作。

相应地,条件作用也可以分为两类:•经典性条件作用:S-R联结,反应由刺激引发。

•操作性条件作用:R-S过程,重在跟随操作后的强化。

操作性作用的两个一般性原则:•任意有强化(奖励)刺激紧随其后的反应都有重复出现的趋向。

•任意提高操作反应率的刺激都是强化刺激。

反射学习:S-R操作性学习:(S)-R-S2强化理论行为发生变化是因为有强化作用。

对强化的控制就是对行为的控制。

强化是能增强反应率的效果(区别与奖励)。

2.1强化物强化物是能增大反应概率的刺激和事件。

分类1:•积极强化通过呈现刺激。

•消极强化通过终止不愉快条件。

分类2:12强化理论2•一级强化满足基本生理需求。

•二级强化与一级强化反复联合进而获得了强化性质的中性刺激。

包括社会强化、信物、活动惩罚是能降低反应概率的紧接在反应后的刺激。

Premack原理应用高频的活动作为低频活动的强化物。

实际教育中,强化种类繁多,效果因人而异。

教学中选取强化物应遵循如下原则:•针对班上不同学生提供不同的强化物系列。

即通过观察和问卷了解不同年级不同学生的不同兴趣。

•考虑年龄因素。

2.2强化程式强化程式(reinforcement schedules)反应受到强化的时机和频次。

•连续强化程式•间隔强化程式。

依据两个维度:时间、比率;固定、可变,组合成四种强化程式。

具体分类:•连续强化,即对每个反应给予强化。

可以迅速学会反应,但反应迅速消失,毫无持续性。

•定时强化,即在固定时段后给予强化。

可以使反应随着强化时间的临近迅速增加,强化后反应数量骤减。

反应具有很短的持续性,当强化时间过去不再出现强化物时,反应速度迅速降低。

•定比强化,即在固定反应次数后给予强化。

反应建立迅速,强化后反应会暂停。

反应具有很强的持续性,当达到预期的反应数而不再有强化物时,反应速度降低。

•变时强化,即不定时给予强化。

反应建立缓慢,稳定,强化后反应不会暂停。

反应具有更长的持续性,反应降低的速度缓慢。

•变比强化,即在不定反应次数后给予强化。

反应建立的速度很快,强化后几乎不会暂停。

反应具有最长的持续性,一直保持很高的水平,不会消失。

程式和反应模式象对应。

连续程式的强化在教新反应时最为有效。

间隔强化又称部分强化,它比连续程式具有更高的反应率和低消退率。

扇贝效应(seallop effect):定时强化由于有一个时间差,强化后随之以较低的反应率,但在时间间隔的末了反应率上升。

定比强化对稳定的反应率比较有益,而变比强化则对维持稳定和高反应率最为有效。

在实际教育中,不想要的行为常常不明智地受到了强化。

一个教师可能正在作间隔式的强化,次侥幸就会使学生永远记住这个行为,学生认识到如果他们一直恳求教师,教师就会最终答应他们的要求。

所以在强化时应遵循如下原则:•教新任务时,进行即时强化,不要进行延缓强化。

在行为主义学习理论中有一条重要的原理就是,后果紧跟行为比后果延缓要有效得多。

即时反馈有两个作用:首先它使行为和后果之间的联系更为明确,其次它增加了反馈的信息的价值。

•在任务的早期阶段,强化每一个正确的反应,随着学习的发生,对比较正确的反应优先强化,逐渐地转到间隔式强化。

•强化要保证做到朝正确方向促进或引导。

不要坚持一开始就做到完美。

不要强化不希望行为。

3行为的学习33行为的学习3.1新行为的塑造对想要的行为进行即时强化是学习的关键,但是,当想要的行为学生一下子做不出时,强化什么呢?一个幼儿教师是否要一直等到幼儿背出全部字母之后才给予强化呢?肯定不是!最好的方法是先对学生说出一个字母,然后是几个,最后是全部字母逐步予以强化。

当老师通过强化每一步的成功以引导学生达到目标时,他就正在使用一种发展新行为的技术—塑造。

塑造(shaping)是通过小步反馈帮助学生达到目标。

Skinner认为“教育就是塑造行为”,他采用连续接近(successive approximation)的方法,对趋向于所要塑造的反应的方向不断地给予强化,直到引出所需要的新行为。

例如,训练鸽子或老鼠的头抬到一定的高度,只有当其头朝着实验所需的方向抬起来时才强化下一次要求再多一点,直到完全达到所需的方向和高度。

这时,新的行为就塑造成了。

在课堂教学中,塑造是一个重要的工具。

假设我们想让学生写一段含有一个主题句和一句总结的英文段落,那么,这一任务包括许多部分:能识别并能写出主题句、佐证材料和总括句;能写出一个完整的句子;能正确使用大小写、标点符号和语法;并且能正确拼写。

如果教师在一节课里教所有这些技能,要求学生写出一段文字,并且根据他们的内容、语法、标点和拼写而评分,那么大多数学生将会失败、学生从练习中将学不到什么。

反之,老师可以一步一步地教这些技能,逐步塑造出最终的技能。

学生可以先学如何写主题句,然后写佐证材料,然后写总括句,在此之前可能专门谈论过如何选题立意。

然后,对段落和标点也提出要求。

最后,拼写也作为一条标准。

在每一阶段,学生都有机会获得强化,因与强化的标准都是他们可能达到的。

在塑造行为时要注意的原则:学生必须在他们力所能及的行为范围内得到强化,同时这些行为又必须能向新的技能延伸。

学生如果能在12分钟之内解出能在15分钟内解出的题,就应强化,但不要要求八分钟内做出才给以强化。

但是,一个能做20题的学生必须做20道题后才应强化。

行为塑造技术包括连锁塑造和逆向连锁塑造两种。

3.1.1连锁塑造(chaining shaping)当学生迅速从成功迈向成功时,使用塑造非常有效。

这就要求将任务分成许多小步子,当学生完成每一步时都予以强化。

这一过程称之为连锁塑造,其步费如下:•终点行为:选择目标——越具体越好。

•起点行为:了解学生目前能做什么,已经知道什么。

•步调划分:列出一系列阶梯式的步子,让学生从他们目前状态迈向你的目标,步子的大小因学生的能力而异。

•即时反馈:对学生的每一进步都予以反馈,材料越新,学生要求的反馈就越多3.1.2逆向连锁塑造(reverse chaining shaping)应用于教育中的另一种塑造形式是逆向连锁塑造,就是“倒序”教授复杂技能。

•首先,我们可以给学生提供一段没有总括句的段落,要求学生补充,但为一篇完整的段落。

•然后,我们可以提供一段不完整的文字,要求学生加上一个佐证材料和句子。

•最后,只提供一个主题句,要求学生写出几个佐证材料和总括句。

这种教学策略的优势在于,每一次练习的成果都是一段完好的文字,以这种方式,学生能更好地看见全貌,并且强化的路线较短。

3.2行为的消退与维持消退(extinction)是消除强化从而消除或降低某一个行为。

例如,教师要求学生应用业余时间完成额外的数学和阅读作业。

几周后他发现学生只做数学业,没有完成阅读任务。

于是教师改变了规则,只让学生在业余时间阅读,结果是,学生很快就少做数学而多看语文了。

在这里,教师应用消退取消对完成数学作业的强化。

再如,在二年级课堂,有些过分焦急的学生不举手就回答老师的问题,这时老师可以不理会他们,点那些举了手的学生起来回答,并且提醒学生“××举了手在等待回答”,“××也举了手”等。

教师很快就会发现全班举手的行为明显增加,并且那些并不参与班上讨论的学生也举起了手,参与讨论的机会增多了。

许多老师发现使用消退比较困难,因为他们必须学会忽视某些不好的行为;其次即使某些问题行为减弱后,它有可能突然重新出现。

这一现象叫做自然恢复。

因此,老师在使用消退时要注意:要前后一致地忽视某些不好的行为,并结合消退使用其他方法,如强化适当的行为。

最后,某些错误行为在密度和频率上一开始会上升,这种上升如果还属于你能容忍的范围,就从这种情境中选择准备消退的行为。

维持(maintenance)就是行为的持续。

消退的原则表明,一旦消除了对过去所学行为的强化,这个行为就会逐渐消失。

这并不意味着教师必须不时地强化学生的行为,否则它们将会消失。

人类生活在一个比较复杂的世界里,对于大多数在学校中学到的技能和行为,我们的世界充满了自然的强化。

例如,一开始学生可能会要求经常强化他们的阅读行为,但是一旦他们会阅读了,他们就具备了了解未知世界的读书的技能。

对大多数学生而言,世界的纷繁复杂本身就有高度强化作用,到了某一时候,不再需要对阅读的强化,因为书的内容木身就维持了这一行为。

当某些行为本身就是一种内在强化时,维持也会发生,即参与这一行为本身就愉快。

例如,许多儿童喜欢绘画、解决问题或学习事物,即使他们从来没因此而得到强化。

抵制消退对维持行为也是很重要的。

一旦形成某一个行为,对正确反应的强化行为变得不那么频繁或不太可预测(变化间隔式和变化比率式强化)。

其原因是变化的强化程式在给出一个强化之前要求有许多行为。

这比固定程式的强化更能抵制消退。

例如,当一个学生每次解数学题之后都给予表扬,但是一且停止表扬,学生就可能停止解数学题。

相反,如果逐渐增加所需做题的数目才得到表扬,那么学生就可能在老师没有给以强化或强化很小的情况下,仍能长时间做数学题。

4行为的分化和泛化行为的结果强烈影响行为,但是,不仅仅是跟在行为之后的刺激有影响,在行为之前的刺激——行为的先前物(antecedent stimuh)也能起重要的作用。

先前物就是在行为之前的事件,也被称作线索(cue),因为它告知我们什么行为将受到强化,什么行为将受到惩罚。

线索表现为许多形式,它暗示我们,什么时候应当改变自己的行为,什么时间不应当改变。

例如,在数学课里,教师强化那些做题的学生,惩罚那些无所事事的学生。

但是当老师宣布下课时正是午饭时间,后果就改变了。

当某一种刺激(这里是数学课时间)存在时表现为一种行为,当另一种刺激(这里是午饭时间)出现时表现为另一种行为的能力就是所谓的刺激分化。

当公司效益好、老板很愉快而你的工作又干得很出色时就是你要求公司老板加薪的时机。

你知道这点,因为你已区分了提出要求的好坏时机。

分化(Discrimination)就是知觉刺激的差异并对这种差异作出反应。

分化就是利用一些线素、信号和信息,这些线索、信号和信息暗示什么时候行为更容易得到强化。

例如,公司的财政状况、老板的心情和你最近的成绩是关系到你的加薪要求能否成功的分化刺激。

学生要学习分化,就必须对他们的反应的正确或错误的行为提供反馈。

分化学习的实验研究表明,学生需要知道什么时间他们的反应是正确的。

相关主题