CNN(畳み込みニューラルネットワーク)とは?
CNN(Convolutional Neural Network)は、画像を認識するために作られた人工知能(AI)の仕組みの一つです。
スマホの顔認識や自動運転のカメラ、病院でのX線画像の解析など、様々な場面で使われています。
普通の画像には「色」や「形」、「明るさ」など、たくさんの情報が詰まっています。
CNNは、こうした情報をうまく整理しながら、「この画像に何が映っているのか?」を理解しようとします。
CNNの仕組みを超ざっくり説明!
CNNの流れは、大きく分けて 3つのステップ があります。
① 畳み込み(Convolution) →「特徴を見つける」
画像の中から、 大事な部分(特徴) を探す作業です。
たとえば、猫の画像なら「耳の形」や「目の配置」など、猫らしいポイントを見つけます。
🔍 どうやって?
小さなフィルター(マスクのようなもの)を使って、画像の一部をチェックします。
「ここに線がある!」「ここは丸い形っぽい!」といった情報を抜き取ります。
② プーリング(Pooling) →「データを減らす」
画像のデータはとても大きいので、少しまとめて小さくします。
これによって、計算がラクになり、余計な情報を減らせます。
📏 どうやるの?
例えば、4つのピクセルの中で 一番大きな値 だけを残す、という方法があります(「最大プーリング」という)。
✅ メリット
- 画像のサイズが小さくなる → 計算が早くなる
- 多少のズレや変化に強くなる(例えば、ちょっと違う角度の猫でもちゃんと認識できる)
③ 全結合(Fully Connected) →「最終判断」
最後に、これまで見つけた特徴を組み合わせて、「これは〇〇だ!」と判断します。
🧠 ここが「脳」っぽい部分!
CNNの「畳み込み」と「プーリング」を通して、画像の特徴を細かく整理しました。
その情報を使って、「これは猫!」「これは犬!」と決めるのがこの部分です。
例:CNNで猫と犬を見分ける!
-
畳み込み(Convolution)
- 「耳がとがっている」「目の形が〇〇」などの特徴を探す
-
プーリング(Pooling)
- 似た特徴をまとめる → 少し画像のデータを減らす
-
全結合(Fully Connected)
- 「猫っぽい特徴が多いから、これは猫!」と判断する
これを大量のデータで学習させることで、AIがどんどん賢くなっていきます。
CNNがすごい理由
🖼 画像に強い!
CNNは「画像から特徴を自動で見つける」ので、普通のニューラルネットワークよりも 画像認識が得意 です。
🚗 色々な場面で活躍!
- 自動運転 → 交通標識や歩行者を識別
- 医療 → CTやX線で病気を発見
- SNS → インスタの「おすすめ投稿」や「顔フィルター」
- 防犯カメラ → 不審者や危険な動きを検知
まとめ
CNNは「画像を理解するのが得意なAIの仕組み」。
「畳み込み」「プーリング」「全結合」の3ステップで、画像の特徴を整理して、何が映っているかを判断します。
これによって、スマホの顔認識、自動運転、医療診断など、私たちの生活に役立つ技術になっています!