これまで人間と機械がコミュニケーションする方法について考えてきました。
これはあくまで人間は機械と違うものであるという前提のもとに説明してきました。
しかし、いっそのこと、人間のコミュニケーションする側面だけを切り取り、
人間は機械の一種であると仮定してみたら、
コミュニケーションする方法が機械と人間で同一のモデルにて記述できるので、
わかりやすいのではないでしょうか。
そこで今回は今後やこれまでの説明がわかりやすくなるように
人間のモデル化について議論していきましょう。
今回は小難しい上に話が長いので、
先に結論だけ言っておきますと
コミュニケーションする人間とは、
・感覚を入力とする
・行動を出力とする
・入出力の間は何かしらのモデルが入っている。たとえばその一部として心の理論がある。
という機械の一種である、という見方ができる。
ということです。
モデルとはなにか
モデルとはいろいろな文脈でいろんな意味で出てきます。ここでは科学的モデルのことをモデルと呼びましょう。
科学的モデルとは"現象"を表現するものとします。現象とは人間の知覚できる物事すべてのことを指します。
モデルで表現される現象は一般的であり、安定しており、相対的であるものを対象とします。そうでないと反証可能性がありません。
一番わかりやすいモデルの例はDNAの二重らせんモデルです。
二重らせんモデルとは人間の遺伝子を構成するDNAが、
・2つの螺旋とその間に梯子のようなもので結合されている形状をしており、
・その梯子のようなものは4種類の化学物質(アデニン、シトシン、グアニン、チミン)だけで作られている
というモデルです。
本来はすごくややこしい化学式のオンパレードなのですが、
こう説明されるとなんだかわかりやすいように思えます。
なんでモデルそのものの話をし始めるのかというと、モデルというものの概念を知ってもらうと、概念をモデルにより説明しやすくなるからです。
たとえば、概念に対して操作がしやすくなる、つまり、ああしたらこうなるだろうと推論しやすくなります。
心理学から見た人間のモデル
さて、ゼロから人間をモデル化するのはさすがにしんどいので、
ここでは先人の知識や知恵を借り、モデルの構築を行いましょう。
まさに巨人の肩の上に乗るってやつですね。
人間をモデル化する上で参考になるのは心理学の知見でしょう。
日本心理学会によると、
心理学は、英語ではサイコロジー(Psychology) ですが、サイコは「心」をあらわし、ロジーは学問とか科学・法則を示します。ですので、心理学を「心の科学」ととらえるのが妥当ですが、では「心」とは何かと 考えると、とても深く広い問題になります。心のはたらきのあらわれとしての「行動」も心理学の対象となるし、意識することができない心の側面である無意識も心理学の対象となります。
と心理学を定義しています[2]。
心理学の中で人間の科学的モデル化に役立ちそうな分野は、
- 心理物理学
- 行動主義心理学
- 認知心理学
があると個人的には考えています。
心理物理学では、中で特に有名なのは、人間に与えられる刺激の量Sと人間が感じる感覚の量Rには関係性があると示した、
フェヒナーの法則があります。
R = k log_{10}S
S=10^{\frac{R}{k}}
実はスマホやテレビの音量と実際にスピーカーに流す電流もフェヒナーの法則に従って構成されており、一段回上げると、指数的に電流を流す仕組みになっています。だから、音量にはデシベルという単位が使われますし、それだけ電流を流すためのアンプが必要となるわけです。物理学と心理学をつなげた画期的な例だと思われます。
心理物理学は刺激と感覚を結びつけただけでしたが、行動心理学はさらに刺激と行動、その学習についてのモデルを作ろうと試みました。
行動主義心理学では人間を刺激S-反応Rモデルで考えることがあります。これは生物の学習メカニズムである古典的条件づけやオペラント条件づけを説明するために使われるモデルです。古典的条件づけとは生物が条件反射を起こす過程を示したメカニズムです。メトロノームの音を聞かせると唾液が出るというパブロフの犬で有名です。一方、オペラント条件づけとはオペラントと呼ばれる生理的欲求とは無関係な行動を引き起こさせる過程を示したメカニズムです。スキナー箱と呼ばれる、音が流れたときにマウスがレバーを押すと餌が出てくるという学習をさせる実験環境で有名です。
最後に認知心理学とは、人間をコンピュータとみなして、人間の認知を情報処理として理解する学問です。
もはやダイレクトにそれな感じがします。
認知心理学ではさまざまなモデルが出てきました。
無意味な情報に対する人間の記憶は時間に対し指数的に消えていくという忘却曲線のモデル、
神経細胞が学習するメカニズムを明らかにしたヘッブの法則とそれを数理モデル化したパーセプトロン、
そして、人間の記憶・言語・学習に関わる認知過程をコンピュータプログラムとして模したACT-R(モデル)です。
コミュニケーションする人間の工学的モデル
ACT-R(モデル)では人間をエージェントモデルと仮定して実装されています。エージェントモデルとは、環境からの影響をセンサで入力し、アクチュエータを出力とすることで環境に影響を与えるモデルです。このACT-Rを皮切りに、ACT-Rのようにモデル化する動きが現れました。
それらのモデルは認知アーキテクチャと総称されています。
認知アーキテクチャには記号主義と分散表象主義、その折衷案の立場に立ったモデルがあります[3]。記号主義とは刺激を記号に置き換えて記号で内部で処理しその結果を出力するという立場です。ACT-Rはこの立場を取ります。分散表象主義とは刺激を神経細胞のようなノードをたくさん用意し、それらのノードをたくさんくっつけて内部処理して、その結果を出力するという立場です。パーセプトロンはこの立場の先駆けといえますが、あくまで認知アーキテクチャではありません。コネクショニズムはこの立場を取ります。記号主義と分散表象主義の折衷案とは、反射などのより物理的な部分は分散表象主義であり、抽象的な機能は記号主義である立場です。
現代のディープラーニングの流れを見ると、分散表象主義でなんとかなりそうな気がしてきます。たとえば、視覚刺激を記号表現と結びつける画像認識はディープラーニングで解決できましたし、音声認識もディープラーニングで解決できました。また、オペラント条件づけの仕組みに近い、強化学習もディープラーニングで大幅に進化しました。それでも分散表象主義で全部を構築するのも大変そうです。特にコミュニケーションの仕組みは記号論で説明しやすいために分散表象主義でどうにかなるのかなという気持ちでいっぱいです。
さて、人間1人のモデルはおそらく現代ではここまでわかっています。
一方で、人間という言葉のとおり、人間は1人では成り立ちません。
コミュニケーションするためには2人以上の人間の相互作用を見る必要があります。
実はエージェントモデルとはそのために作られたものになります。
この沢山のエージェントモデルを利用したモデルをマルチエージェントシステムと言います。マルチエージェントモデルじゃねぇのかよと思うかもしれません。ですが、相互に影響を与え合う点で個々でモデルを単純に足したわけではなく、1つの複雑な機構を生み出すシステムとみなす立場があるのだと思います(適当)。
マルチエージェントシステムの例にセル・オートマトンがあります。セル・オートマトンとは、エージェントが細胞上に詰まっており、隣り合うエージェントに影響を与え合うシステムです。ぱっとみ一番面白いのは、一定の法則で黒くなったり白くなったりするライフゲームです。まるで生き物が無から生まれているように見えますが、見えるだけです。見た目がかわっているだけで、オートマトンの数は変わってません。
図 ライフゲームの例(Kieffさんの作品、CC BY-SA 3.0)
人間もコミュニケーションによって他人に影響を与えられ、また与えることができます。
その観点から個人がエージェントモデルであると仮定すれば、人類とはマルチエージェントシステムで記述できることがわかります。
人類というマルチエージェントシステムの中で我々個人はどのように人類からプログラムさせられているのかという点も人間のモデル化の視点では必要だと思われます。
まとめ
今回は人間のモデル化という壮大なテーマを取り扱いました。
壮大なテーマを取り扱いましたが、つまるところ、人間とは、
・感覚を入力とする
・行動を出力とする
・入出力の間は何かしらのモデルが入っている。たとえばその一部として画像認識があり、心の理論がある。
というエージェントモデルの一種である、という見方ができるということがお分かりいただけたでしょうか。
次回はエージェントモデルを使った機械学習手法、
強化学習を使ってエージェントモデルへの理解を深めていきましょう。
#参考文献
[1] https://plato.stanford.edu/entries/models-science/
[2] https://www.psych.or.jp/public/
[3] http://www.sig-agi.org/home/ren-zhiakitekucha
[4] https://upload.wikimedia.org/wikipedia/commons/e/e5/Gospers_glider_gun.gif