はじめに
2023年は、ChatGPIや生成AIが登場して、AIに対する考えが大きく変わった一年でした。
人間にしかできないと思われていたようなことが、実は、巨大なニューラルネットを使えばできるとわかって、人間って何なんだ?みたいな疑問もでてきた一年でした。
「脳ちゃんとタマ子」という本(漫画で書いてあって、楽しく読めます)を読んだとき、脳ちゃんの説明が、ニューラルネットやLLMの動きとオーバーラップしてきました。
この本が勧めている考え方や生き方が、人間の知能の源であり、AGIの目指す事なんじゃないか。という個人の感想を書いてみます。
この記事は、私個人のポエムです。楽しんで読んでただければ幸いです。
脳ちゃんとタマ子
この本は、タマ子とタマ子の脳の対話を漫画で描いたものです。
タマ子は自分の意志でいろいろなものを選択しているのか?
という問いがありました。
例えば、ペンを持つ時、タマ子は、次の順番で脳が働いていると思っています。
①意思(ペンを持とう)
②準備(手の動かし方を準備する)
③命令(手を動かしてペンを持つ)
④感覚(ペンを持った感覚が得られる)
私も、タマ子と同じ意見でした。
しかし、脳ちゃんが言うには、実際は、
⓪何かの指示がある
①準備(手の動かし方を準備する)
②意思(ペンを持とう)
③感覚(ペンを持った感覚が得られる)
④命令(手を動かしてペンを持つ)
意思で動いているのではなく、その前の何かの指示があって動いているというのです。
何かの指示ってなに?
AIの学習の一つに強化学習があります。
将棋の対戦を何回もさせて、勝った場合は報酬を与え、報酬が最大になるようなモデルをニューラルネットで作るものです。
以前、4目並べのAIを作ってみました。学習済みモデルを作るのが大変でしたが、できてしまえば、現在の盤面を入力すると、最適な手が出力に現れます。
ざっくりですが、この強化学習を大量のデータで高度に実施したのがLLMだと思ってます。
ChatGPTの例
ChatGPに現在の状況を入力して、どのような出力が得られるか試してみましょう。
この記事で試してみた例です。
次のような入力を与えてみます。
messages1 = [
%{
role: "system",
content: """
あなたは、母親です。自分の子供と会話をしています。
いまは午後3時。午後6時から晩御飯。
子供へのメッセージとお母さんの気持ち、次の会話に必要な情報を次のフォーマットで出力
MSG:子供へのメッセージ
FEEL:母親の気持ち
"""
},
%{
role: "user",
content: """
おやつちょうだい
"""
}
]
この結果出てくるのは、
「今はおやつの時間ではないよ。晩御飯まで我慢してね。」
きわめて人間ぽい行動を出力してきました。
人間の脳はニューラルネットでできていて、このニューラルネットの出力が、「⓪何かの指示」にあたります。
タマ子は、生まれてから32年間、脳に入力してきた様々なデータをインプットしつづけてきていて、この入力で学習した脳に現在の状況を入力して、得られた出力で行動をしている事になります。
人間とAIの違い
今のLLMは、ChatGPIが司法試験に受かるレベルだとか、生成AIで絵をかいたりと、ある部分では人間並みになっています。
人間の感情のようなもの(お母さんが子供におやつをあげるかどうか)などもLLMで再現ができています。
とても素晴らしい技術だとおもいます。
これらは、人間の創作物を教師として、学習させたもので、一般的な人間と同じような振る舞いができるようししたもだと思います。
人間を教師データとして、作り出したもと言えます。
これだと、人類の知能を超える事はできません。
人間は、言葉を話したり、道具を作ったりできます。
道具もスマートフォンのような非常に高度なものを作れます。
一部は他の動物にはできる事もあるかもしれませんが、このような知能を持っているのは、人間だけです。人間は、どうやってこれを身に着けたんでしょうか。
これを理解しないと、人間を超える知能を実現する事はできなないでしょう。
新しい知能を生み出せるようになれば、AGIが実現できるんじゃないでしょうか。
現在、過去、未来
昆虫のような生物は、感覚器官から信号を脳への入力して、その出力で動作しています。
学習済みのニューラルネットが遺伝子に組み込まれていて、生まれてくれば同じように動作する制御系ができあがっている感じです(実際はどうかわかりませんがイメージです)。
下等な生物の場合、これで話は終わりなんだと思います。
人間には、現在、過去、未来を考える事ができます。これが、知能が向上する土壌になっているとおもいます。
この本では、過去と現在の関係について、取り上げられています
大抵の人は、過去→現在だと思っている。
実際には、過去は、今で創られる。同じように、今は、未来で創られる。と言っています。
何かの出来事があった時にそれをどの様にとらえるかは、人それぞれです。
例えば、上司に叱られた過去も現在の自分によって変わります。
- 自分はダメな人間だと落ち込む(自分はダメ人間だと思ってる人)
- 自分の間違いがわかり成長できた体験だと思う(成長したいと思っている人)
未来と今の間にも、現在と過去と同じ関係を考えられます。
こんなようなことがかかれています。詳しいことは、マンガを読んでみてください。
脳内では、感覚器官から信号や過去の出来事をニューラルネットの入力しますが、この過去の出来事は、今の自分に依存します。今の自分は未来の自分に依存して調整されています。
この調整をどの様にするかが問題ですが、この本では、
「すべては自分の望む未来へとつながっていると信じる事」
という話がでてきます。
飛躍してるかもしれませんが、望む未来に都合が良いように調整する事と解釈してみます。
自分の望む未来ってなんだ
これは、人それぞれだと思いますが、この本を読んで思ったのは、
みんなの幸せみたいなものらしいです。
あなたの望む未来はなんですか?と聞かれると、「人類の平和です」とか「みんなの幸せです」なんてなかなか言えませんが(正直、お金持ちになりたい。とか言いたいですが)、悪いことではないし、確かにこうなったらいいなぁ。とは思うので、受け入れる事にします。
幸せとは何か。
では、「幸せ」とはなんでしょうか。この本では、次のような事が紹介されてました。
幸せホルモン、オキシトシンが分泌されること
↓
心を一つにできるような人がいると分泌される
↓
人間関係を築けて心がしっかりつながってると感じられると、分泌される(幸せになる)。
↓
他の人に共感したり、他人を理解する力が大切
という事が挙げられています。確かに。普遍的な幸せかも。
オキシトシンは、人間に組み込まれた仕組みで、人類はこれに従って、行動するようになっている。
他の人に共感したり、他人を理解するように作られている事になります。
人類の知能
人間は、同士がコミュニケーションをとりながら、進化してきました。
人類全体として知能を生み出したとも言えます。
これをモデル化してみると、
- AIのノードを複数作る。
- 他のノードと共感し他ノードを理解するように過去の出来事を調整する
オキシトシンにあたる調整機能を使って、ノードの入力を調整する事で、システム全体が発散せずに動作させられ、新し知能を生み出す事ができる。
ニューラルネットの学習を発散させないで収束できた人達だったら、このようなモデルも実現できるんじゃないか。arxivにこのようなモデルの論文が発表される事を楽しみにしています。
まとめ
私が、いままでの人生の経験で得たもの(偉そうに言えるものはありませんが)が多少なりとあります。
この本を読んでみて、ああそうだよなぁ。とか、脳ちゃん良いこと言うなぁ。と思うことがありました。
実際に私は、人類の1ノードとしての行動をとっている証拠で、あながち間違ってないのではないかと思いました。
みなさんも「脳ちゃん」を読んで、人間の知能のネットワークに参加しましょう。
AGIが現実になる前に、「脳ちゃん」から学べる事を学んでおきましょう。