YouTubeでも公開中
この記事の内容は動画で見ることもできます!
前回の続きです。
前回は、ニューラルネットワークの基礎を解説しました。
この内容をベースとして、ニューラルネットワークの中の動きについて、もう少し詳しく解説していきます。
内部の動きを理解するために、まず、ニューラルネットワークに入力される画像がどうなっているのかを知っておきましょう。
画像の構成要素
ニューラルネットワークでは、入力層に数値を入力し、掛け算や足し算、活性化関数の計算を繰り返しながら、数値を運んでいきます。そして、最終的な結果が、出力層に出てきます。このとき、入力層にいれる数値とは、どのような数値でしょうか。画像を分類するニューラルネットワークを作る場合を例にして、入力される画像について、もう少し詳しくみていきましょう。
今回は、分かりやすくするために、シンプルな画像を考えます。これは、数字の「0」を手書きした画像です。画像は 28×28 ピクセルで作られています。1 ピクセルにはそれぞれ、白から黒の色がついていて、それらがたくさん集まることで、1つの画像ができています。
これらの色は、コンピュータ内では「数値」として表されています。白は「1」、黒は「0」として表され、薄くなると、だんだん「1」に近づき、濃くなると「0」に近づきます。この数字を集めることで、1枚の画像を作る事ができます。
さて、今回はもっとシンプルな画像を考えます。この図は 8×8 の空間に、0, 1, 2, 3, 4, 5, 6, 7, 8, 9 を書いた画像です。この図を数値で表すと、0.0〜1.0の数値の集まりになります。説明の都合上、文字の部分を「0.9」、背景を「0.1」とします。ニューラルネットワークには、このような画像が入力されます。
ニューラルネットワークの入力と出力
さて、ここからは、実際に画像が入力される場合を考えてみます。ニューラルネットワークの入力と出力に注目しましょう。
今回は分かりやすくするために、中間層のないニューラルネットワークにします。入力のニューロンを 64 個、出力のニューロンを 10 個にしました。なぜ、このニューロン数に決めたのでしょうか?
入力層の仕組み
入力層の 64 個のニューロンは、8×8 の画像を表しています。画像の 64 ピクセルの数字を、入力層の 64 個のニューロンに入れます。つまり、画像の数字が、それぞれ1つずつニューロンへ入っていくという事です。基本的なニューラルネットワークの場合、このように、画像の全画素の数だけ、入力ニューロンを用意します。
出力層の仕組み
次は出力層に注目します。出力層の 10 個のニューロンは、0〜9 の 10 個の数字を表しています。最終的に、この 10 個のニューロンには、ニューラルネットワーク で計算された結果が入ってきます。出力層では、全てのニューロンに、結果の値が入ってきます。
この 10 個のニューロンで、一番大きな数字のニューロンが、判別結果となります。
続きはYouTubeに公開しています!
ねこアレルギーの AI
続きはYouTubeに公開しています。お時間ある方は覗いていただけると喜びます。
https://www.youtube.com/channel/UCbCHn_q5MUAz5ZDNA-wKsug
Created by NekoAllergy