Deep Learning入門:今Deep Learningに取り組むべき理由
14本の動画の再生リストとなっております。
Deep Learningに興味はあってもどのように知ればいいのか案外分からなかったりするので、こういう無料で知れる情報が提供するのはありがたいですね。
せっかくなので視聴する
どんな内容について説明されているのか動画を見ながら雑に内容について書いていきます。
1動画6~15分程度なのでコツコツ観るのにちょうどよくありがたい構成となっております。
1本目の動画
Deep Learning についてざっくりとした概要とかを説明しているようです。
-
データセットを用意する
手書きの数字とかを大量に用意するっぽい -
Deep Learningにより機能開発が大きく変わる
-
End-to-end学習
-
入力から出力を得る機能をデータからの学習で調節獲得
-
Deep Learningは汎用性が高く、様々な開発に生かせる
画像認識、文章の自動仕分け、音声認識、機械翻訳、人工無能など -
Deep Learningは高い性能を出すにも関わらず、実は非常に簡単である
-
勝敗を分けるのはノウハウではなくアイデアとデータ
-
これらのゲームチェンジに対応するためには、多くの思考転換が必要
-
このためDeepLearningの持つポテンシャルの割には活用があまり進んでいない事実
-
DeepLearningすごいのに人間の意識の方が全然追いついていない!この動画を見てできるだけたくさんの人が直接触れて活用してほしい!DeepLearning活用者が今の10倍100倍になれば現代の生活がもっと豊かになる!
視聴感
1.5倍速かな?と思うくらいのペースで話しているのに説明が非常に分かりやすいです。
DeepLearningをとにかく広めたいから有益な情報を無料公開してしまうソニーの小林さん、太っ腹です。
これを機会にみんなで機械学習に詳しくなって、ディープラーニング系エンジニアとなってかっこよくなってしまいましょう。
2本目の動画
-
Deep Learningとは要するに脳の学習機能をコンピュータでシミュレーションしている
-
それを人工ニューロンという
-
それを複数組み合わせたものがニューラルネットワークである
-
ニューラルネットワークは様々なバリエーションがある
-
例えば動画内の画像認識のニューラルネットワークは入力層と出力層とその中間層がある
-
入力層は人間でいうと網膜
-
中間層で入力層で入ってきた情報の重みを足す(計算する)←これは動画内の図を見た方がはやいかも
-
中間層で重みを足して計算したものを出力層に送る
-
そして、Deep Learningはそのニューラルネットワークのニューロンの数や層の数を大きくしたものである
-
Deep Learningでは中間層の数が3層以上、場合によっては1000層以上もある
-
従来はこのような大規模なものは計算が非常に重かったが、近年はGPUとインターネットにより実現できるようになった
-
動画では例題として手書き数字の画像認識を行う
-
サンプルとして手書きデータセット6万枚(0~9の手書き数字がそれぞれ6000枚)
-
画像が28x28=784pxとして、その座標に対応した784個に対応したニューロンを用意する
例)
x:0, y:0
x:1, y:1
...
x:27, y:27 -
対して出力ニューロンは0~9に対応する10個のニューロンを用意
-
中間層の数は適当に
→ニューロン数に正解はないため。いろいろ試してみてより正確な値が出る方を選別していく -
設計はここまで
-
次に、入力ニューロンと出力ニューロンのシナプス結合の強さ、入力ニューロンからの信号を掛けて足すその掛ける値重み(w)を初期化する必要がある
-
初期化するために、乱数を用いる
-
それにより、学習前の赤ちゃん脳が出来上がる
どのように学習するか
-
学習用データから1枚を入力する
-
初期値はランダムなので、認識結果も当然ランダムになる
-
例えば、1を入力して、6に相当するニューロンの電気信号が0.3と最も大きくなり、1に相当するニューロンの電気信号は0.1と非常に小さい値しか出力しないということが起こる
-
しかし、学習用データでは1の手書きデータは1という答えもあらかじめわかっているため、1に対応するニューロンの電気信号が1.0、他の電気信号は0.0になるように、結合の重み(w)というのを少し調整する
-
そして別の画像を入力する。
-
上記を繰り返す。今回は60万枚分の画像を見せるまで行う。つまり画像1枚あたり10回見せる
-
そして、学習によって次第に画像に対して正しいニューロンに1.0が出力されるようになる
-
これが画像認識問題においてニューラルネットワークを学習するということに相当する内容である
-
そして、学習できた状態ならば学習用データは不要となる。
-
ニューラルネットワークの構成とニューロンとニューロンのシナプス結合の強さ、結合の重み(w)の値を保存しておく
-
これをプログラムとして実行することで、学習の時には用いていなかった新しい画像を入力しても、正しい数字を入力できるようになる。
たった10分の動画2本でニューラルネットワークのざっくりとした仕組みを理解することができた
今の段階だと、理解した気になっているだけ?かもしれませんが、Deep Learningについて全くわからん状態から、「ああなんとなくそういう仕組みなんだ~」という状態にまでなりました。
なんと素晴らしい動画なんでしょう。
ひとまず今回はここまでにしておきますが、次の動画を観るのが楽しみです。
ここまで読んでいただきありがとうございました。
今回紹介した動画は図付きでもっとわかりやすく説明されていますので、ぜひそちらも視聴してみてください。
それでは。