More than 1 year has passed since last update.

画像処理の実践

Posted at 2023-10-21

前回、画像処理の入門ということで、OpenCVを使って画像の読み書き、グレースケール化や２値化、簡単な図形の描画を紹介しました。
前回の記事はこちらになります。

今回は、もう少し実践的な内容を紹介したいと思います。
前回同様、今回もレナの画像を使用します。
レナの画像

画像の切り出し

画像を読み込んで、その中の一部だけを抽出する処理になります。
処理は非常にシンプルです。

入力画像[top:bottom, left:right]

外の四角が画像全体となり、top,bottom,left,rightで指定した値が以下のように囲まれ、切り出しされます。

ソースコードはこちら。

import cv2
import numpy as np

# 画像読み込み
img = cv2.imread("lena_std.bmp")

# 切り出し
output = img[0:256, 0:256]

# 画像書き込み
cv2.imwrite("output.bmp", output)

実行結果はこちらになります。

画像の平滑化

平滑化とはぼかす処理のことです。
OpenCVにはいくつかの平滑化手法がありますが、今回は一般的な平滑化処理(cv2.blur)で記述します。

import cv2
import numpy as np

# 画像読み込み
img = cv2.imread(filename="lena_std.bmp")

# 平滑化
k = 25
output = cv2.blur(src=img, ksize=(k, k))

# 画像書き込み
cv2.imwrite(filename="output.bmp", img=output)

ksizeは、カーネルサイズを意味します。
詳細は、下記のサイトを参考にしてください。
簡単に言えば、数値を大きくすればするほど画像がぼけます。

実際の出力例をいくつか見てみます。

その他の平滑化の手法は以下のサイトを参考にしてください。

エッジ検出

エッジ検出は、画像の色の境目が急激に変わる場所のことをエッジと言い、それを検出することです。
エッジ検出にもいくつかの手法がありますが、今回はCanny法という手法を使用します。

import cv2
import numpy as np

# 画像読み込み
img = cv2.imread(filename="lena_std.bmp")

# エッジ検出
output = cv2.Canny(image=img, threshold1=0, threshold2=0)

# 画像書き込み
cv2.imwrite(filename="output.bmp", img=output)

２つの閾値をもとにエッジ検出を行います。
値が小さいと、色の変化が小さい箇所でも検出され、値が大きいと色の変化が大きな箇所でも検出されないことがあります。
実際に、いくつかパラメータを調整して試してみます。

このように、値を調整してエッジ検出を行っていきます。
その他のエッジ検出は以下のサイトを参考にしてください。

顔検出

顔検出とは名前の通り、画像にある人の顔を検出することです。

import cv2
import numpy as np

# 画像読み込み
img = cv2.imread(filename="lena_std.bmp")

# 顔検出
cascade = cv2.CascadeClassifier("haarcascade_frontalface_default.xmlのパス")
list = cascade.detectMultiScale(img)

# 検出箇所を四角で描画
if len(list):
    for (x, y, w, h) in list:
        cv2.rectangle(img=img, pt1=(x, y), pt2=(x+w, y+h),
                      color=(0, 0, 255), thickness=2)

# 画像書き込み
cv2.imwrite(filename="output.bmp", img=img)

Haar Cascadesを使った顔検出を使用します。
詳細は下記のサイトを参考にしてください。

OpenCVにはHaar Cascadesを用いた顔検出がデフォルトで使用できます。それがhaarcascade_frontalface_default.xmlというもので、私の場合は下記のパスにこのファイルがありました。

"C:\Users\**\AppData\Local\Programs\Python\Python311\Lib\site-packages\cv2\data"

実行結果は以下の通りになります。

プログラムの流れは以下の通りになります。

画像読み込み
顔検出を適用し、検出結果を取得する。
１つでも検出できた場合は、赤い四角で検出箇所を描画する。
今回はlistに検出結果が入っており、listは検出した座標と幅と高さが返ってきます。
画像書き込み

目の検出

目の検出は、顔検出ほぼ同じプログラムになります。
「haarcascade_frontalface_default.xml」を「haarcascade_eye.xml」に変えるだけです。
実行結果は以下の通りになります。

顔にモザイクをかけてみよう

ここまでの内容を組み合わせて、実際に簡単なソフトを作ってみます。
今回は、顔にモザイクをかけるものを作ってみます。
コードは以下の通りになります。

import cv2
import numpy as np

# 画像読み込み
img = cv2.imread(filename="./lena_std.bmp")

# 顔検出
cascade = cv2.CascadeClassifier("haarcascade_frontalface_default.xmlのパス")
list = cascade.detectMultiScale(img)

if len(list):
    for (x, y, w, h) in list:
        # 顔検出した箇所を切り抜く
        cutout = img[y:y+h, x:x+w]

        # 平滑化でぼかす
        filter = cv2.blur(cutout, (25, 25))

        # ぼかした箇所を上書きする
        img[y:y+h, x:x+w] = filter


# 画像書き込み
cv2.imwrite(filename="output.bmp", img=img)