「オペラント条件づけ」を含む日記

はてなキーワード: オペラント条件づけとは

2021-03-20

■ウマ娘は純度100%のギャンブル？　そんなことあるわけないじゃないか。

トレーナーは毎秒のようにくじ引きをしてる？　そんなことあるわけないじゃないか。

『トレーニングくじ』が当たったらステが伸びて

『サポカくじ』が当たれば友情タッグが出たりスキルのヒントが貰えたりしてステが大幅伸びて

『レースくじ』が当たったら望んでたバ場状態になったり、出遅れが回避できたり、たれ馬事故が回避できたり、ちゃんとスキルが発動したりして

合間の『コミュくじ』が当たったらクラシック前にマエストロヒントや愛嬌、練習上手◯が手に入ったりして

なんだかんだで一定以上のステータスで優勝できたら『因子くじ』が引けたりして

因子くじに勝ったら、次のウマ娘への『因子継承くじ』を引いて、当たればその娘のステが大幅に伸びたりして

そんな感じで何回もくじを引き続けて強い娘が集まったら、競技場で『雑魚格上くじ』を引いて、当たればランキングが上がったりして

ランキングや育成が頭打ちになったら、今後は『育成ウマ娘くじ』と『サポカくじ』を引いて☆3娘やSSR カードが当たれば戦力の底上げができたりして

そしてまた『トレーニングくじ』を引き始めたりして

でも僕らトレーナーは『ただくじ引きしてるだけ』って感覚は全くないんだ。

だって、僕らは育成してる可愛い娘と一緒にトレーニングを積み重ねて、レースで勝ちを積み重ねて、ステータスを積み上げて、一番を目指して成長して、一緒に泣いたり笑ったりしながら、前へ前へと突き進んでるんだから。

この素直でかわいいウマ娘たちとのかけがえのない時間が、大量の時間を溶かしながら、ただひたすら『くじ引きしてる』だけだなんて、そんなことあるわけないじゃないか。

たまにSSRや☆3を当てさせたり、たまに友情タッグを成功させたり、たまに針治療で強くさせてみたり、たまに最高のタイミングでスキルヒントを与えたり、たまにルーレットダービーでビンゴさせたりして、僕らに馬券が当たった時のような強烈な脳内麻薬を出させたりしているなんて、そんなことあるわけないじゃないか。

まさか僕らのサイゲさまが、僕らに考える暇を与えないために毎秒のように「部分強化」を強要して、着々とオペラント条件づけを進めているなんて、そんなことあるわけないじゃないか。

様々なドラマを残した競走馬たちが眠る墓を掘り起こして、美少女のガワに押し込み、死なないのをいいことにいつまでも稼がせようだなんて

史実からテキトーにつまんだエピソードを混ぜた都合のいいシナリオや、それっぽい会話や二人三脚の育成という名のフロー体験を駆使して、トレセン学園とかいうなんかキラキラした世界観で魅せて感情面に訴えることで、その事実に気づかせないようにしてるなんて

騎手がいなくなったのをいいことに、6枚も必要とさせる完凸前提にサポカを徐々に強くさせながら出したり、限定アイテムコード入りの新曲を買わせたりしながら、デレステ以上に長い期間をかけて金を搾り取ろうとしているだなんて

そんなことあるわけないじゃないか。

Permalink | 記事への反応(0) | 21:47

2020-05-26

■anond:20200526213320

対戦車犬

犬の背中に爆薬と起爆スイッチとなる木製レバーを設置し、レバーを垂直に立てた状態で戦車へ走らせる。犬が戦車の下に潜り込んだところで起爆レバーが倒れ、敵戦車を破壊する計画であった。
犬の訓練にはオペラント条件づけを利用した。戦車や装甲車輛の下に犬の餌を置き、空腹の犬が餌を目当てに戦車の下に潜り込むように教え込むというものである。実戦では空腹の犬を敵戦車の前に放つだけで自発的に爆弾を運ぶことが期待されたが、精度は高いとは言い難く、たとえ訓練を積んだ犬といえども、敵戦車が走行する際に発する激しい騒音に怯え、逃げ去ったり自陣に駆け戻り自爆するなど、扱いの難しい兵器であった。

Permalink | 記事への反応(0) | 21:43

2019-09-07

■行動主義心理学を10分で理解する

はじめに

行動主義はJ.B.Watsonが最初に提唱した心理学の哲学だ。この哲学は、現代では下火のように見なされてたり、あるいは棄却すべき対立仮説のように扱われることが多い。

しかし、実際には認知心理学者、あるいは認知科学者が槍玉にあげる行動主義は、誤解に基づくものか、そうでなくても「その行動主義を自称している行動主義者は現代にはいないよ」と言わざるをえないような藁人形論法であることが少なくない。

そこで、行動主義の誕生から現代的な展開までの歴史について、ごくごく簡単にまとめてみようと思う。

Watson の行動主義

行動主義は、Watson が 1913 年に提唱した。

Watson の基本的な主張は、ご存知の通り「心理学の対象を客観的に観察可能な行動に限る」というものだ。

当時の心理学は Wundt の提唱した「内観法」を用いて人間の持つ「観念連合」を記述する、というものであった (余談だが、内観法は単なる主観報告ではない。これもよくある誤解である。Wundt の提案した心理学は、繰り返しの刺激に対し、同じように報告するよう徹底的に訓練することにより、人間の持つ感覚の組み合わせについて首尾一貫とした反応を得ようという研究方針である)。

Watson が反対したのは、Wundt の方法論である「人間の自己報告」を科学データとすることである。それに代わって、刺激と反応という共に客観的に観察可能な事象の関係を研究の対象とすべきであると主張した。Watson は Pavlov の条件反射の概念を用いれば刺激–反応の連関を分析可能であるし、人間の持つ複雑で知的な行動も刺激–反応の連鎖に分解できると考えた。

また、情動や愛のような内的出来事は、身体の抹消 (内臓や筋肉) の微細運動から考察された。Watson の心理学が「筋肉ピクピク心理学」と揶揄される所以であるが、現代の身体性を重視する心理学・認知科学を考えると、(そのまま受け入れることはできないにせよ) あながちバカにできない部分もあるような気がする。

さて、認知心理学者、認知科学者が批判するのは多くの場合 Watson の行動主義である。場合によっては、次に登場する Skinner と Watson を混同して批判する。

注意しなければいけないのは、Watson の行動主義の立場を取っている行動主義者は、この地球上にはもはや存在しないという点である。従って、Watson 批判は歴史的な批判以上の何物でもなく、現代の科学の議論ではない。

では、行動主義を自認する現代の研究者が寄って立つ立脚点は何なのか？その鍵になるのが、Skinner の徹底的行動主義である。

Skinner の徹底的行動主義

Skinnerは、Pavlov の条件反射を「レスポンデント条件づけ (いわゆる古典的条件づけ)」、Thorndike の試行錯誤学習を「オペラント条件づけ」として区別し、概念、および実験上の手続きを整備した。そのためあってか、Skinner は20世紀で最も影響力のある心理学者 1 位の座についている。

Skinner は、科学の目的を「予測 (prediction)」と「制御 (control)」とした。ここでは説明しないが、そのためにの強力な武器として概念としては「随伴性 (contingency)」、方法論として「単一事例研究」などを導入した。彼の心理学は他の心理学とは大きく異なる用語法、研究方法を持つため、「行動分析学」と呼ばれる。

徹底的行動主義では、Watson が扱ったような客観的に観察可能な「公的事象」に対し、「私的事象 (ようは「意識」のこと)」もまた、同様の行動原理によって説明できると主張した。つまり、内的出来事も「行動」として捉えられる、ということだ。文字通り「徹底的」に行動主義なのである。実際に、Skinner の著書の中には「知覚」「感じること」「思考すること」といった、内的な事象についての考察も多く、それらは行動分析学の重要な対象であるとはっきりと述べている。

逆に Skinner が反対したのは、「心理主義的な説明」である。心的な活動は実在するし、それ自体研究の対象ではあるが、「心的な活動によって行動が駆動される」という因果的な心理主義に対しては、Skinner は反対であった。つまり、「原因としての心的概念」の導入に反対したのだ。この点を間違えると、Skinner を完全に誤解してしまう。

ただし個人な見解としては、行動分析学はほとんど顕在的な行動以外実際には扱っていないし、扱うための具体的な方法論を発展させてもいない。そこに関しては批判を免れないとは思う。

行動分析学の他に重要な特徴として以下の 3 つが挙げられる。

(1) 「反応」を運動のパターンとして定義するのではなく、「どんな結果事象を引き起こすのか」から 定義する機能 主義

(2) 人間の営みを超えた真理探究ではなく、行動の予測と制御という現実的な有効性の上昇を目指すプラグマティズム

(3) 仮説構成体・仮説群から 研究を演繹するのではなく、実験結果から 法則を抽出する帰納 主義

なお、帰納主義については「え？でも科学って演繹と帰納の両輪で回ってるんじゃないの？」と考える人もいるかもしれない。

Skinner は「行動について我々は知っているようでまるで知らない。そのような若い科学にはまず、具体的なデータが必要なのだ」と考えた。そのため、Skinner は環境 (刺激) と反応の間の関数関係のデータの蓄積を重視した。

つまり、あくまで当時の知的状況を鑑みての方針だったということは重要な点だ。

ちなみに、Skinner は自身の徹底的行動主義と区別するため、Watson の行動主義を「方法論的行動主義 (methodological behaviorism)」と呼んでいる。

また、次に述べる Skinner の同時代の行動主義も、同様に方法論的行動主義とまとめられることが多い。

Skinner と同時代の行動主義 (新行動主義)

Watson のアイデアを発展的に継承したのは Skinner だけではない。

ただし、Skinner 以外の新行動主義に与している研究者は、現代には皆無なので、あくまで歴史的な展開として捉えるべきである。

Guthrie

Guthrie は刺激と反応の間にできる連合は「時間的接近」によって生じることを述べた。また、Hull や Tolman と異なり、心理学の研究対象は客観的に観察できる行動に限定すべきであるという姿勢は堅持した。

Hull

Skinner と大きく異なる点として、Hull は「仮説構成体による演繹」を重視した。「習慣強度」という潜在変数を導入したモデルを考案し、その潜在変数の挙動の変化により行動の予測に挑戦した。

Hull の研究の問題点は、いたずらに潜在変数をいくらでも増やせてしまい、理論が肥大化する危険をはらんでいるためである。特に Hull や Skinner の時代は、行動に関するデータがまだまだ少なく、行動研究には強固な地盤がなかったのである。Skinner は「理論は必要か？」という論文で理論研究を批判していているのだが、Skinner が批判したかったのは Hull の心理学だったのである。

Tolman

Tolman は刺激と反応の間に「仲介変数」を導入した心理学者だ。いわゆる S-O-R の枠組みである。彼は「潜在学習」の研究によって、「学習」と「成績」は必ずしも一致しないことを見出した。そのことから、刺激と反応の間には、それを仲介する隠れた変数がある、と考えた。

Tolman からすると、「感情」「期待」といった内的な出来事も、刺激と反応の間に存在する仲介変数である。

現代の視点で見ると、認知心理学の下地になるアイデアを提出したのが Tolmanだ。

ところで、Tolmanと地続きである認知心理学もまた、徹底的行動主義の立場からすると方法論的行動主義に立脚した心理学である。そう、私たち現代心理学徒のほとんどは、意識せずとも方法論的行動主義者なのだ！

なぜか？認知心理学でも、公的事象と内的事象を分ける。内的事象には直接アクセスできないので、公的事象の「操作」と計測を通じて内的事象の研究をする。公的事象の操作 (実験条件) を通じて、内的事象の定義を行う。これは、Stevens-Boringの「操作主義」と呼ばれる。操作主義では、操作と計測の対象は公的事象であり、内的事象については「研究者間での合意」に基づいて議論される。つまり、例えば「この条件によって反応時間に変化があったら、作業記憶に影響があったということにしようね」というのが、研究者集団によって暗に共有されている、ということだ。これが、認知心理学が「方法論的行動主義」と呼ばれる所以である。

Skinner 以降の展開

1980年代以降、Skinner の弟子筋の研究者たちの間で、Skinner 以降の行動主義を巡って、研究方針が多様化しつつある。その中でも最も影響力のある 3 つについて、簡単に紹介したい。

Heyes の機能的文脈主義

Skinner の行動分析学はプラグマティックな科学であると言われているが、実は Skinner 自身は表立ってプラグマティズムに述べていたわけではない。例えば、近い時代を生きたパース、ジェームズ、デューイを直接引用して主張を行なっていたわけではない。一方、Heyes の機能的文脈主義の特徴は、Skinner の徹底的行動主義の持つプラグマティズムをより明示的に推し進めた点にある。

Skinner は心的概念を導入することを否定した。私的出来事 (内的過程) は外的な行動の原因ではなく、それ自体独立した行動として捉えるべきだと考えたためだ。また、心的概念による説明は、行動分析学の目的である予測と制御に寄与しないと考えたことも一因である。

Heyes の場合、そのような概念でも、予測と変容 (influence) に寄与する場合は、十分に有用であると考える。

具体的には、「態度」を測る質問紙研究が好例だ。質問紙で測る「態度」は Skinner であれば「質問紙に回答行動」として見なされる。しかし、Heyes の場合「そのような研究の問題点は、測ったところで、実際の行動を変容させるための操作変数が同定できないことだが、最終的に行動の予測と変容を目指すという目的がぶれない限り、足がかりとしては有用である」と主張する。

このような、伝統的な行動主義と比較してある意味で軟化した態度を、Heyes は「行動主義心理学の自由主義化」であると述べている。

少し脇道に逸れるが、Heyes は行動の「制御 (control)」とは言わず、「変容 (influence)」と表現する。これは、「制御」だと決定論的に操作できる印象を受けるが、実際の行動には確率的な変動性が必ずついてまわるため、表現を柔らかくする意図である。

また、機能的文脈主義では、研究の真偽の真理基準にも明示的にプラグマティズムを導入している。

行動主義の科学には必ず目的がある (多くの場合、それは現実の問題解決と結びついているが、そうでないものもある)。Heyes の標榜するプラグマティズムは、目的にかなうかどうかが、研究の真偽を決める、ということだ。

これは、「うまくいけばなんでもok」という主観主義ではない。問題解決としての科学として、発見というよりは創造のプロセスで知見が生まれるということだ。ただし、解決されるべき「目的」の方はどうしても恣意的にはなってしまう、と Heyes は述べている。

Baum、Rachlin の巨視的行動主義

巨視的行動主義の特徴は以下の 2 つにまとめられる。

(1) 分析単位として「随伴性」ではなく「相関性 (correlation)」

Skinner はレスポンデント条件づけは刺激−反応という 2 項随伴性、オペラント条件づけは刺激–反応–刺激という 3 項随伴性によって定式化し、随伴性こそが考察されるべき基本単位であると考えた。

巨視的行動主義は、そうは考えず、よりマクロな「強化子–反応率」の相関性が行動主義心理学の分析単位であると主張している。

つまり、ミクロな刺激と反応の関係を捉えるよりも、マクロな環境と行動の関係を捉えることを重視しているのが、巨視的行動主義である。

行動主義心理学の目的を予測と制御に置くならば、結局はマクロな記述で十分であり、その方が有用であるというのが彼らの主張だ。

(2) 内的出来事の導入の拒否

Skinner は外的な行動とは別に内的な出来事もまた行動として捉えられると考えた。巨視的行動主義ではそうは考えない。

彼らは、内的な出来事を「潜在的な行動 (covert behavior)」と呼んでいるが、心理学はそれを直接対象とする必要がないと論じている。なぜなら、潜在的な行動が実際に効力を持つならば、最終的には顕在的な行動 (overt behavior) として表出されるためである。

このことを彼らは「時間スケールを長くとる (temporally extended)」と表現している。瞬間瞬間に我々には豊かな精神活動 (mental life) があるが、それを相手取らなくても、長い時間観察すれば、観察可能な行動として現れる、ということである。

Staddon の理論的行動主義

Staddon の主張は、他の行動主義と大きく異なる。彼の場合は、心的概念の導入を許容する。そして、それを用いた「理論」こそが心理学に必要であると考えた。その点は、実験結果から法則を抽出する帰納を重視した Skinner の立場とは異なる。また、「心的概念による説明」は Skinner の反対した「原因としての内的過程」でもあり、それを採用する点も Staddon の特徴である。

行動主義心理学の目的は、予測と制御だけではなく「説明」にもあると彼は主張した。Staddon の言う「説明」とは、概念同士の関係によって、現象を記述することである。わかる人にとっては、David Marr の「アルゴリズムと表現」の位置に心理学を位置づけている、と考えればすっきり理解できるように思う。

Staddon はやや言葉遣いが独特で、概念連関による記述を「メカニズム」と呼んでいる。そのメカニズムは必ずしも生理学的基盤を前提しないで、あくまで心理学的レベルでの記述である。

ようは、行動のアルゴリズム的な理解なのであるが、事実 Staddon は「私の言うメカニズムとは、アルゴリズムのことである」とも述べている。

Skinner は反応率 (時間あたりの反応数) を分析の基本単位としたが、Staddon はより多元的である。ただし、なにを分析の単位とするかは、それ自体が研究の立脚点を示しているものである。それを Staddon は「The model is the behavior」という言葉で表現している。

それでは認知心理学となにが違うのか？と思われるかもしれない。Staddon いわく、行動主義心理学が伝統的に堅持してきた「強化履歴」は理論的行動主義でも重要であるというのが大きな違いらしい。つまり、行動や内的状態は、それまでの環境との相互作用に基づいている歴史性を有しているとういうのだ。当たり前といえば当たり前なのだが、その点を強調するか否かである。

また、Staddon は「動的過程 (dynamics)」を重視した点も特徴である。他の行動主義は、基本的には刻一刻と変化するような過程というよりは、安定した反応の推移を対象としてきた。ややテクニカルな議論ではあるが、現代では複雑な時系列データを扱う方法もたくさん用意されているので、動的な過程を取り上げるのは科学として自然な展開であると思う。

一方、認知心理学では「コンピュータアナロジー」のように、入力–出力関係を固定して考えることが多い。動的に内的状態は推移していることを重視した点も、Staddon の理論的行動主義と認知心理学を分ける特徴の 1 つである。しかし、個人的にはこの差異は徐々に埋まっていくのではないかという期待もある。

おわりに

以上、行動主義 100 年の歴史を簡単に振り返ってみた。

色々なアイデアはあるものの、基本的に現在「行動主義」を標榜している人がいれば、Skinner の徹底的行動主義である。Watson、Hull、Guthrie、Tolman に依拠している者はいない。従って、歴史批判ではなく、科学の議論として行動主義を批判したければ、Skinner を相手にするべきである。

行動主義はとにかく誤解されがちである。それは行動主義心理学者サイドにも問題があるにはあるのだが、科学において、無理解の責任は基本的には不勉強側に帰せられるべきだろう。

個人的には、アンチは信者より詳しくあってほしい。認知心理学者も、自分たちが寄って立つフレームワークの出自はどこにあって、なにに対するアンチテーゼだったのかをきちんと理解してみたら、何か発見があるかもしれない。

Permalink | 記事への反応(2) | 17:00

2016-03-07

■http://anond.hatelabo.jp/20160307203608

スキナー「別にゲームに限らず全ての人間の行動はオペラント条件づけに支配されとるんやで」

Permalink | 記事への反応(2) | 20:49