「学習心理学」における重要用語のひとつであるオペラント条件付け/道具的条件付け(operant conditioning)について解説いたします。
目次
オペラント条件付け/道具的条件付け(operant conditioning)とは?
ソーンダイクの「猫の問題箱」に始まり、新行動主義者であるスキナーの「スキナー箱の実験」で示されたもの。
特定の自発的行動(オペラント行動)に対して、何らかの刺激(強化子や罰子)を与えることで、自発的行動の生起頻度を変容させる操作のこと。
※オペラントとは自発的なという意味である。
スキナー箱の実験
オペラント条件付けの代表的な研究者であるスキナーは、自らが創案したスキナー箱を使って実験を行った。
【スキナー箱の実験の概要】
スキナー箱にラットを入れ、ブザーが鳴った時にラットが箱に備えついているレバーを押すと餌が出てくるという手続きを繰り返し行った。
すると、初めはめったにレバーに触れなかったラットが、明らかにレバーを動かす頻度が増えた。
この場合、レバーを押す行動がオペラント行動、きっかけとなるブザーの音を弁別刺激という。
また、行動の生起頻度が増加することを強化(reinforcement)、そのきっかけとなる報酬(この場合餌)を強化子(reinforcer)という。
※このように、対象が目的とする行動をとった後に強化子を与えることによって、行動が強化されることを見出した。
三項随伴性
オペラント条件付けでは、人間や動物は「弁別刺激-オペラント反応-反応結果(強化子・罰子)」という関係で制御されていると考えられており、この関係を三項随伴性(three-term contingency)と呼ぶ
【三項随伴性】
・行動が自発されるきっかけとなる先行刺激(弁別刺激):A
・結果に作用されるオペラント行動:B
・自発行動の結果によって行動の出現頻度を変化させる強化子:C
※三項随伴性はABC(Antecedent-Behavior-Consequence)分析とも呼ばれる。
シェイピング
オペラント条件付けにおいて、新たな行動を獲得するために、標的とするオペラント行動をスモールステップに分け、獲得が簡単なものから段階的に形成していく方法をシェイピングという。
この方法は、学習効率を効率よくするために有効とされている。
【具体例】
犬にお手を覚えさせるために、①飼い主の近くに来たら餌を見せる。
②次に目の前に断ったら撫でる。③その次は前足をちょっとでもあげたら餌を食べさせる。
という具合に少しづつ段階的に行動を形成していく。
結果として、標的とするオペラント行動であるお手をさせるということを学習できる。
オペラント条件づけ正と負,強化と罰
オペラント条件づけは、刺激の提示により行動を増加したり減少させる手続きである。そのため、以下のようなモデルが成立する。
正 オペラント行動に随伴して、刺激を与えること。 |
負 オペラント行動に随伴して、刺激を取り除くこと。 |
|
強化 |
正の強化 望ましいオペラント行動に対して、好ましい刺激を与えること。 |
負の強化 望ましいオペラント行動に対して、不快な刺激を除去すること。 |
罰 |
正の罰 望ましくないオペラント行動に対して、不快刺激を与えること。 |
負の罰 望ましくないオペラント行動に対して、望ましい刺激を除去すること。 |
※正負は、刺激を与えるか取り除くか。強化・罰はオペラント行動が増加するか減少するか。
正の強化
報酬刺激を与えることで、オペラント行動を生起させる手続きのこと。
例:宿題をやった子供をほめる。しっかりと働いた社員に賞与を与える。
正の罰
嫌悪刺激を与えることで、オペラント行動を低下させる手続きのこと。
例:悪いことをした子供を叱る。不正をしたプレイヤーに注意する。
負の強化
嫌悪刺激の除去により、オペラント行動を生起させる手続きのこと。
例:シートベルトを着用したら警告音が消えた。煙草を吸ったらイライラが消えた。
負の罰(オミッション訓練)
報酬刺激の除去により、オペラント行動を低下させる手続きのこと。
例:違反をした車の運転手に対して、罰金を課す。
ポイント
学習心理学の基礎の部分で非常に重要な考え方が詰まっています。
三項随伴性の考え方も、正負、強化・罰の分類も非常に重要ですので理解しておくことをおすすめします。
また、オペラント学習は臨床にも応用されています。以下に代表的な心理療法を貼っておきますのであわせてご覧ください。