はじめに
画像処理(Image Processing)で手軽に遊べるデモサイトをFlaskで作りました。
画像処理の基本的なアルゴリズムを実装しているので、画像処理を今まで触った事がないという人は、良かったら触ってみて下さい。スマホでも遊べます。
■デモサイト
IP World
■環境
Python, AWS(Lightsail), Flask, Docker
デモ一覧
デモの一覧は、以下の通りです。
# | タイトル | 内容 |
---|---|---|
1 | Binarization | 画像の二値化(大津法, スライダーによる閾値変更) |
2 | Edge Detection | フィルタ処理によるエッジ検出 |
3 | Dilate Erode | 領域の膨張・縮小処理 |
4 | Open Close | オープニング・クロージング処理 |
5 | Thinning | 細線化処理 |
6 | Labeling | オブジェクトのラベリング処理 |
7 | High Contrast | ヒストグラム平坦化による高コントラスト化 |
8 | Denoise | メディアンフィルタによるノイズ除去 |
9 | Unsharp Masking | 先鋭化処理 |
10 | Area Fitting | 領域に対する矩形のフィッティング処理 |
以下、個別に簡単なデモで紹介して行きます。
1. Binarization
こちらは、画像の二値化処理です。
いわずとしれた大津法を初期値として、閾値を0~255までスライダーで動かせるようにしています。
10パターン程画像を用意しているので、スライダーで閾値を動かして色々と遊んでみて下さい。
2. Edge Detection
こちらは、微分フィルタを利用したエッジ検出処理です。
画像内のエッジ成分(輝度変化の大きい箇所)を抽出します。
フィルタ/処理は以下の6種類で、各ボタンで切り替えができます。
- Prewitt-h:Prewittフィルタ(水平方向)
- Prewitt-v:Prewittフィルタ(垂直方向)
- Sobel-h:Sobelフィルタ(水平方向)
- Sobel-h:Sobelフィルタ(垂直方向)
- Laplacian:Laplacianフィルタ(2次微分)
- Canny:Canny法
最初の4つは一次微分フィルタであるため、輝度勾配がなだらかに抽出されていますが、二次微分フィルタのLaplacianでは、細かいエッジ成分が抽出されているのがわかると思います(一方で細かいノイズ成分も強調される)。
Canny法はフィルタではなく、細線化と閾値判定を含むエッジ検出用の処理なので、他のフィルタ処理に比べて、エッジ成分が明確に抽出されている事がわかります。
3. Dilate Erode
こちらは二値化画像における、領域の膨張(Dilate), 縮小(Erode)処理です。
大津法で元画像を二値化した画像に対し、「Dilation」を押すと黒いピクセルの領域が膨張し、「Erosion」を押せば領域が縮小して行きます。
ボタンの押下に応じて処理が走るので、連続して押したり、交互に押したりと、画像がどのように変化するのか試してみて頂ければと思います。
4. Open Close
こちらも処理自体は膨張・縮小処理ですが、膨張と縮小を複数回繰り返す事で穴埋めやノイズ除去を目的としたOpening, Closing処理です。
- Opening:複数回の縮小処理 ⇒ 複数回の膨張処理
- Closing:複数回の膨張処理 ⇒ 複数回の縮小処理
Openingは先に縮小処理をするので、ノイズや小さい領域を除去する効果があります。一方Closingは、膨張処理を先に実施するため、領域内の穴を埋めるような動きをします。
処理の繰り返しは、それぞれ3回ずつに設定しています。
5. Thinning
こちらは二値画像の細線化処理です。
先ほどまでの縮小処理は、画素の外側を削って行く処理でしたが、こちらは、領域の中心の1画素分だけを残すように線を細くする処理になります。
アルファベットのようなケースでは、アルファベットの形状を構成する骨格の要素を抽出できている事がわかると思います。
6. Labeling
こちらは二値化画像において、連続した領域にラベルを付けて行くラベリング処理になります。
ピクセルが連続した領域に同一のラベルを振るため、独立したオブジェクトの個数を抽出する事ができます。
今回は元画像にそのままラベリング処理を適用していますが、膨張・縮小処理と組み合わせ、ノイズや穴を埋めた上でこのラベリング処理を施す事で、より綺麗にラベルを振ることができます。
7. High Contrast
こちらはヒストグラム平坦化を使った高コントラスト化処理になります。
元画像は低輝度領域に画素値が集中しており、コントラストが低い状態のため、RGB空間で画素値が一定に分布するように(ヒストグラムが平坦になるように)処理し、コントラストを上げています。
RGBそれぞれでヒストグラム平坦化をかけると全体の色味が崩れるため、RGB空間全体でヒストグラム平坦化をかけています。
パッと見では暗くて何も見えない画像でも、実はこれだけの情報を持っている(綺麗に再構成できる)というのは面白いですね。
写真を撮った時に、やたらと暗くなってしまったからと言って、諦めなくても良いかもしれません。
8. Denoise
こちらはメディアンフィルタを使ったノイズ除去処理です。
各画素値を、対象の画素を含む周辺9画素の中央値(メディアン)で置き換える事によって、ごま塩型のノイズを除去する事ができます。
シンプルな処理でノイズが除去できる一方、全画素を周辺画素の中央値で置き換えてしまうため、全体的に少しぼやけた画像になってしまっているのも見て取れるかと思います。
9. Unsharp Masking
こちらは画像のボヤけた輪郭を強調する先鋭化処理(アンシャープマスク処理)です。
元画像を平滑化した画像と元画像の差分要素を求め、この差分を元画像に加算する事で、輝度変化のある箇所を強調する処理になります。
先鋭化処理によって、ぼやけた元画像がくっきりとした画像になっている事がわかると思います。
10. Area Fitting
こちらは二値画像の各領域に対するフィッティング処理です。
矩形や円をフィッティングさせる事で、領域の大まかなサイズを抽出する事ができます。
フィッティングは以下の4種類です。
- Rect:外接矩形(回転なし)
- Rotate:外接矩形(回転あり)
- Circle:外接円
- Ellipse:楕円フィッティング
それぞれ対象領域に合わせて、矩形や円がフィッティングされている事がわかるかと思います。
ざっくりのサイズであれば外結矩形、対象が種や細胞のような形状の場合は、楕円フィッティングが良さそうですね。
まとめ
いかがだったでしょうか。
ちょっとした復習と備忘も兼ねて作ってみましたが、画像処理に触って楽しんで頂けたのであれば幸いです。
機械学習の労力の8割がデータ収集と前処理と言われるように、画像においても前処理観点での画像処理は重要な上、そもそも、機械学習を使わず画像処理だけで落とせればベストではあるので、画像処理も高いレベルで使いこなせるようになって行きたいですね。
■参考
Qiita記載記事
・AIで遊べるデモサイト「AI World2」
・AIで遊べるデモサイト「AI World」
・Deep Metric Learning
・Deep Learning for Image Denoising
・ホテル暮らしはクラウドである
・AIの実業務適用に必須なHITLという考え方と、HITLを加速させるAI×RPA
・RPAの推進に必須なRPAOpsという考え方
・VBAが組める人ならRPAは簡単に作れるという罠
個人ブログ
・キャリア・フレームワークなど