初 Qiita 記事です!
森川 幸人 さんの著書『イラストで読むAI入門』を読んでいこうと思います。
そのさい、読んで学んだことを皆様にもシェアできたら嬉しいと思い、読書メモをこちらにまとめます。この記事は、その読書メモ記事群の第一回目です。(第二回目はこちら)
(注意:この記事は「私の研究記事」ではなく、あくまで『イラストで読むAI入門』の読書メモです。学んだことをまとめました。私の読書勉強ノートが誰かの役に立ちますように)
(また、AI 系は文献によって微妙に定義が異なったりするので、この記事では、あくまでこの本に書いてあることだけを書きます)
参考文献・参考記事
- 『イラストで読むAI入門』| 森川 幸人 さんの著書。良書だと思ったので今ここで読書メモを書き始めた。
- 『Microsoft Azure Machine Learning とは』 | Azure Machine Learning とは、機械学習モデルのトレーニング、デプロイ、自動化、管理を行うためのクラウド サービスであり、これらの操作のすべてをクラウドによって提供される幅広い規模で行うことができます。
- 『Azure Machine Learning Studio のアルゴリズムの選択方法』|これすごい。いっかい読んで欲しい。分かりやすい
- 『機械学習の重要な用語の用語集』 | 精度, 曲線下面積 (AUC), 二項分類, F 値, ハイパーパラメーター, 教師あり機械学習,再現率, 正則化, 回帰, 相対絶対誤差, など
- 『今さら聞けないバックプロパゲーションとは』
- 『人工知能やディープラーニングの理解に欠かせないパーセプトロンとは何か?』
- 『パーセプトロンからはじめる分類問題』
- 『人工知能AIブームの歴史』
AI ブームの歴史
ことがら | 期間 | 背景 | キーワード |
---|---|---|---|
"AI" 誕生 | 1956年 | アメリカの認知科学者のミンスキーが命名。学会でこの単語が使われた | 人工知能 |
第 1 次 AI ブーム | 1956 ~ 60年代 | コンピュータの出始め | パーセプトロン |
第 2 次 AI ブーム | 1980年代 ~ 90年 | 家庭にコンピュータが普及 | バックプロパゲーション |
第 3 次 AI ブーム | 2011年以降 | クラウドやつよつよコンピュータが使えるように。また、インターネットで学習データが集めやすい | ディープラーニング |
AI というネーミング
AI
は Artificial Intelligence (人工知能)
の略で、
1956 年のダートマス会議で生まれた言葉。
アメリカの認知科学者の ミンスキー がダートマス大学で
『The Dartmouth Summer Research Project on Artificial Intelligence』(人工知能に関するダートマスの夏期研究会)という名前の学会を開催した。
ここで世界で初めて「人工知能」という言葉が使われた。
(写真は ウィキペディア『マービン・ミンスキー』 より)
『人工の知能』って、すごい名前を付けましたね! 人工の知能。強そう。
本に戻ります。
この命名からは、機械に言語を扱えるようにさせる自分たちの研究により、機械がいずれ人間の知能に追い付くのだという意気込みが感じられると思います。
いきなり話が横道に逸れますが、このとき「インテリジェンス(知能、知性)」という言葉を使わず、「マシンラーニング(機械学習)」くらいにしておいてくれれば、そのあとの苦労は少し減ったのではないかといわれています。いきなり「知能、知性」などといってしまったおかげで、背負っているものがとても大きくなってしまいました。
(『イラストで読むAI入門』 27 ページより)
(私の AI 詳しい知り合いが「俺は何でも AI って言うのは好きじゃないんだよね。機械学習ならいいけど」って言ってたのを思い出しました。この認識って彼個人だけのものではなかったんだなあと思いました。)
当時、人間の知性についての理解がまだ今よりは進んでおらず、コンピュータで代換可能だと思われていた。でもどんどん人間の知性についての理解が進んできて「人間の知性は思ってたよりすごかった」状態に。
そのため「最初にもう少し軽めに目標設定しておけばよかったのに」という声が上がっているわけです。
(『イラストで読むAI入門』 28 ページより)
あっという間に終わった第一次 AI ブーム
現在、AI は 3 回目のブームと言われている。
最初のブームは、ちょうどコンピュータが出始めた頃で、前述のダートマス会議から始まった。
最初の AI は「 パーセプトロン 」というモデルで、簡単な記録と判断ができました。
(『イラストで読むAI入門』 28 ページより)
パーセプトロンとは、1957年、ローゼンブラットというアメリカの研究者によって考案されたアルゴリズムのことですが、人工知能や機械学習、ディープラーニングなどのアルゴリズムの礎になっており、それらを理解する上では必須知識です。
(@yudsuzuk さんの記事『人工知能やディープラーニングの理解に欠かせないパーセプトロンとは何か?』より)
Perceptron。
ちなみに Microsoft の機械学習クラウドサービス Azure Machine Learning で使えるアルゴリズム一覧を見てみたら『averaged perceptron』とかもあった。
『Azure Machine Learning Studio のアルゴリズムの選択方法』
パーセプトロンについて色々調べたくなったけど、止まらなくなりそうなので、いったん置いといて、取り敢えず本を読み進める。
当時「パーセプトロンすげー!コンピュータとこれがあれば人間の知能を置き換えられるのでは」って盛り上がったけど、そのパーセプトロンに致命的な欠陥が見つかった。
しかし、パーセプトロンに致命的な欠陥が見つかり、あっという間にブームは収束してしまいました。ブームを収束させたのも、ダートマス会議の主催者の一人であるミンスキー本人でした。
(『イラストで読むAI入門』 30 ページより)
AI の能力のひとつに「問題を正しく分別できる」がある。「それは正しいか間違いか」「それは赤いか白いか」などを対象ごとにきちんと学習、判断できることが求められた。
単純パーセプトロンで、非常にシンプルな対象についてはちゃんと分別できることが分かったけど、〇と×の線引きが直線的にしかできないという問題が発覚した。直線では分けられても、曲線では分けられない。これを「 非線形問題 」とか「 線形分離不能問題 」とかいう。
人間の脳細胞ニューロンをまね, コンピューター上で最初に表したものがパーセプトロン(perceptron)である. データを2つのクラスに線形で分離するために考案された. それゆえ非線形問題は解決できず
(@ruka38 さんの記事『パーセプトロンからはじめる分類問題)
この問題があって、単純パーセプトロンは実用的ではない、と、ミンスキー(ダートマス会議開いた人)が気づいて、数学的に証明し、第一回目の AI ブームはあっという間に過ぎた。
第二次 AI ブーム
第二回目のブームは二十世紀終わり頃。
パーセプトロンの欠点をうまく克服した「 バックプロパゲーション 」というモデルが発明されて、「これはいけるかも!」となったわけです。
(『イラストで読むAI入門』 33 ページより)
バックプロパゲーション (Backpropagation) とは『 誤差逆伝播法 (ごさ ぎゃく でんぱ ほう)』とも呼ばれているようですね。
今さら聞けないバックプロパゲーションとは
機械学習では神経細胞のネットワークを模倣したニューラルネットワークを用いて推論を行っていきますが、学習の過程で推論と正解値が異なる場合があります。そのまま続けた場合、学習の精度があまり良くない状態となってしまうので、出力結果を元にニューラルネットワーク全体の修正をその都度を行っていく仕組みがあります。その仕組みがバックプロパゲーションと呼ばれる方法です。
バックプロパゲーションは別名、誤差逆伝播法(ごさぎゃくでんぱほう)と呼ばれ、1986年にデビッド・ラメルハートらによって命名されました。バックプロパゲーションの役割はコンピュータの回答が間違っていたり、期待とは離れている場合、誤差を出力側から逆方向に返し、各ニューロンの誤りを正す役割となります。
(記事『今さら聞けないバックプロパゲーションとは』より)
しかし、なかなか実用に使えるような精度にまでは到達しなかった。
人の生活を変えられるような精度を出せず、世の中の役に立つかどうかというところで、ブレイクスルーが起こらず、
二回目のブームは二十世紀を超えられないまま、何となく消えて行ってしまいました。
(『イラストで読むAI入門』 34 ページより)
第三次 AI ブーム ← 今ここ
2012 年に ディープラーニング ( 深層学習 ) が登場したことにより、現在また AI ブームが始まった。
毎年開かれていた画像認識コンテスト『ILSVRC (ImageNet Large Scale Visual Recognition Challenge)』で、
2012 年に突然いきなり登場して驚異的な成績をあげた AI があり、
「なんだこれは」と大騒ぎになった。
トロント大学のヒントン教授が引っさげて来たこの ディープラーニング という AI モデルは、実は全くの新型モデルだったわけではなく、2回目のブームの主役だった バックプロパゲーションの改良型 でした。
(『イラストで読むAI入門』 36 ページより)
ディープラーニング とは、ざっくり言うと
- 『 畳み込みニューラルネットワーク 』
- 『 多層ニューラルネットワーク 』
というふたつの AI を合体させたもので、
これらはいずれも 2回目のブームの時にすでに個別に開発されていた。
しかし、両者を組み合わせただけでこんなに精度が上がって強力なものが出来るとは誰も思っていませんでした。まさに灯台下暗しです。
(『イラストで読むAI入門』 36 ページより)
第三次 AI ブームは、従来のものとは違う
この第三次 AI ブームは、今までの「学者の間だけでのブーム」とは違って、一般の人たちも巻き込んでいる。
Google や Microsoft, IBM などの大企業が巨大な投資をしているから。
参考1:マイクロソフト、AI研究企業に 1100億円 投資 | すごい額だ
参考2:マイクロソフトは2022年までに1万5000名の労働者にAIのスキルと資格証明を賦与
Google の例。
グーグルはウェブ検索サービスを始めたときから、検索のデータなどを集めているといわれていますし、グーグルマップなどでの検索、カーナビなどの利用データなども集めているようです。そのような ビッグデータ はデータ量が多過ぎて、もはや人や簡単な計算では解析しきれなくなってきています。
そこで、ビッグデータから有用な情報を取り出す作業 (これを「 データマイニング 」といいます)を AI にやらせる必要性が出てきました。
(『イラストで読むAI入門』 38 ページより)
また、インターネットにより、ディープラーニングに教えるべき大量のデータ(これを「 教師信号 」という)が集めやすくなったことも AI が発展した大きな要因。
まとめ
ここまでが、『イラストで読むAI入門』の 40 ページ目までの、AI の歴史についての内容です。
私が 1日で読める内容はここまででした。
今に至るまでの変遷が物語のように「簡単な感じで」書いてあって、とても面白く読むことが出来ました。私のこの読書経験のメモが皆様の役に立てたら嬉しいです。
次は ニューラルネットワーク などの話題について書きます。
(『イラストで読むAI入門』著者の森川先生、こんな素晴らしい本をこの世に出してくださってありがとうございます!勉強します!)
次回、続く!
2019/11/12
追記:続きの記事を公開しました!
→ 『イラストで読む AI 入門』読書メモ 02:ヒトの神経細胞とニューラルネットワーク入門の入門