オペラント(道具的)条件付け(operant/instrumental conditioning)
オペラント(道具的)条件付け
『オペラント(道具的)条件付け』は”ソーンダイク(Thorndike、E. L.)”の『試行錯誤学習』の研究がもとになり生み出された理論です。
オペラント(道具的)条件付けは”スキナー(Skinner, B. F.)”により提唱されました。
スキナーはソーンダイクが研究に用いた猫の実験箱を単純化し、その装置を『スキナー箱』と呼びました。
スキナー箱
実験箱の中にはブザーとレバーがあります。
ブザーが鳴っているときにレバーを押すとエサが与えられる仕組みになっています。
箱の中に空腹のネズミを入れます。
はじめネズミはエサがもらえる仕組みを分からず、エサが得られません。
しかし、たまたま、ブザーが鳴っているときにレバーを押すとエサが与えられます。
これを繰り返すうちにネズミは「ブザーが鳴った時」に「レバーを押す行動」を学習するようになります。
ソーンダイクの試行錯誤学習では、動物が環境に自発的に働きかけるあらゆる反応のうち、特定の反応の直後にエサなどの無条件の刺激を随伴(一緒に)させることで、その特定の自発的な反応が『条件(オペラント)反応』となることを示しています。
そこでの反応は随意的(思いのまま)に環境に働きかけ、環境物を操作するもの(『オペラント』)のため、スキナーはオペラント(道具的)条件付けと名前をつけ再定義しました。
このように、本来「ブザーが鳴ること」と「レバーを押すこと」にはなんの繋がりもありませんが、「ブザーが鳴った時(刺激)」に「レバーを押す(反応)」と「エサが出てくる(『強化』)」場合には、「ブザーが鳴る(刺激)」と「レバーを押す(反応)」ことに繋がりが生まれるようになります。
このような、刺激(『先行刺激』)→反応(『オペラント反応』)→結果(強化もしくは『罰』)の3つの項による連鎖を『三項随伴性』と言います。
つまり、オペラント(道具的)条件付けは人や動物の自発的で意図的な反応を増大、低減させることを目標として行われる手続きのことを指します。
- 先行刺激
反応の前の刺激を指します。
上の図では「ブザーが鳴る」ことを指します。
- オペラント反応
人や動物の行動が生じた直後の環境の変化によって、頻度が変化する反応や行動のことを指します。
上の図では、ブザーが鳴った時にレバーを押すことでエサが与えられるため、ブザーが鳴った時にレバーを押す行動の頻度が増えます。
そのため、ここでは「ブザーが鳴った時にレバーを押す」ことがオペラント反応に相当します。- 強化
反応(オペラント反応)に随伴してある刺激を与えることで、反応を増大させることを指します。
- 『正の強化』は快の刺激(好子)を与えることを指します。
- 『負の強化』は不快な刺激(嫌子)を取り去ることを指します。
- 罰
反応(オペラント反応)に随伴してある刺激を与えることで、反応を低減させることを指します。
- 『正の罰』は不快な刺激(嫌子)を与えることを指します。
- 『負の罰』は快の刺激(好子)を取り去ることを指します。
- 強化子
強化はオペラント反応の頻度を増大させることを指しますが、そのために与えられる刺激を『強化子』と言います。
上の図では「エサを与えること」を指します。
『レスポンデント(古典的)条件付け』では、『条件刺激』と『条件反応』の関係が強化されると、その条件刺激と類似した刺激に対しても条件反応が生じるようになります。
これを『般化』と呼びますが、『オペラント(道具的)条件付け』でも同様の現象が見られます。
また、レスポンデント(古典的)条件付けでは、特定の条件刺激の時のみに強化し、それと似た刺激に対しては強化せずにいた場合、その特定の条件刺激にしか条件反応は起こらなくなります。
これを『分化』と呼びますが、オペラント(道具的)条件付けでは『弁別』と呼び理解します。
オペラント(道具的)条件付けにおいて、特定の反応が生じる確実なきっかけとなる刺激を『弁別刺激』と言います。
さらに、レスポンデント(古典的)条件付けでは、条件付けが成立した後、『無条件刺激』の対提示をせずに条件刺激のみを提示し続けると、条件反応との繋がりが失われることがあります。
これを『消去』と言いますが、オペラント(道具的)条件付けでは、反応の直後に『強化』を全く行わないことにより消去が行われます。
繰り返し行われる特定の行動のどれにいつ『強化』を与えるかによって、反応が増大、低減することがあります。
これをプログラムにしたものを『強化スケジュール』と呼びます。
スキナーは、オペラント反応(従属変数)は三項随伴性や強化スケジュールといった独立変数によってコントロールされており、この「刺激ー反応ー強化」の関係を分析して独立変数を見出し、行動の基本的法則を見出し解明していくことが行動科学の目標であると考えました。
またこの法則を実際場面に応用する分野として『行動分析学』を提唱し、これらは教育場面などに活用されていくことになりました。
- 般化
弁別刺激以外の類似した刺激でも反応が生じることを指します。
上の図では、「ブザーの光の色を多少変化させてもレバーを押す行動が生じること」を指します。
- 弁別
ある刺激でのみ反応が高く維持され、別の刺激では反応が低く維持されることを指します。
上の図では、「通常のブザーの光の色では、レバーを押すとエサを与え、違うブザーの光の色の時にレバーを押してもはエサを与えないようにすると、ブザーの光の色を区別してレーバーを押す行動がなくなる」ことを指します。
- 弁別刺激
弁別刺激は特定の反応が生じる確実なきっかけとなる刺激を指します。
上の図では、ネズミがブザーの鳴っている時にはレバーを押し、ブザーの鳴っていないときにはレバーを押さなくなった場合、「ブザーが鳴る」ことが『弁別刺激』となります。
- 消去
条件づけ成立後、反応の直後に『強化』を全く行わないことにより、反応が見られなくなります。
上の図では、「ブザーが鳴った時にレバーを押してもエサを与えないことが続くと、ブザーが鳴ってもレバーを押さなくなる」ことを指します。
- 強化スケジュール
繰り返し行われるオペラント反応のどれにいつ『強化』を与えるかによって、反応が増大、低減することがあります。
どのような時間間隔や反応回数で強化を与えるかによって分けられています。
- 『定時隔強化』は反応数にかかわらず、一定時間の間隔で強化子が随伴される。(例:週給や月給制の仕事)
- 『変時隔強化』は反応数にかかわらず、不定時(平均すれば一定)の間隔で強化子が随伴される。(例:留守の多い電話先への電話かけ)
- 『定率強化』は、一定数の反応後に強化子が与えられる。(例:出来高払いの仕事)
- 『変率強化』は、不定数(平均すれば一定)の反応後に強化子が与えられる。(例:ギャンブル)
参考・引用文献
森岡正芳編 (2022) 『臨床心理学中事典』野島一彦 (監修), 遠見書房.
\動画での解説はこちら/
\この記事を書いた人/
臨床心理士・公認心理師
上岡 晶
Ueoka Sho
精神科・心療内科での勤務を経て、2023年から「オンラインカウンセリングおはぎ」を開業しました。私のカウンセリングを受けてくださる方が少しでも望まれる生活を送れるように、一緒に歩んでいきたいと考えています。