前回、画像処理の入門ということで、OpenCVを使って画像の読み書き、グレースケール化や2値化、簡単な図形の描画を紹介しました。
前回の記事はこちらになります。
今回は、もう少し実践的な内容を紹介したいと思います。
前回同様、今回もレナの画像を使用します。
レナの画像
画像の切り出し
画像を読み込んで、その中の一部だけを抽出する処理になります。
処理は非常にシンプルです。
入力画像[top:bottom, left:right]
外の四角が画像全体となり、top,bottom,left,rightで指定した値が以下のように囲まれ、切り出しされます。
ソースコードはこちら。
import cv2
import numpy as np
# 画像読み込み
img = cv2.imread("lena_std.bmp")
# 切り出し
output = img[0:256, 0:256]
# 画像書き込み
cv2.imwrite("output.bmp", output)
画像の平滑化
平滑化とはぼかす処理のことです。
OpenCVにはいくつかの平滑化手法がありますが、今回は一般的な平滑化処理(cv2.blur)で記述します。
import cv2
import numpy as np
# 画像読み込み
img = cv2.imread(filename="lena_std.bmp")
# 平滑化
k = 25
output = cv2.blur(src=img, ksize=(k, k))
# 画像書き込み
cv2.imwrite(filename="output.bmp", img=output)
ksizeは、カーネルサイズを意味します。
詳細は、下記のサイトを参考にしてください。
簡単に言えば、数値を大きくすればするほど画像がぼけます。
その他の平滑化の手法は以下のサイトを参考にしてください。
エッジ検出
エッジ検出は、画像の色の境目が急激に変わる場所のことをエッジと言い、それを検出することです。
エッジ検出にもいくつかの手法がありますが、今回はCanny法という手法を使用します。
import cv2
import numpy as np
# 画像読み込み
img = cv2.imread(filename="lena_std.bmp")
# エッジ検出
output = cv2.Canny(image=img, threshold1=0, threshold2=0)
# 画像書き込み
cv2.imwrite(filename="output.bmp", img=output)
2つの閾値をもとにエッジ検出を行います。
値が小さいと、色の変化が小さい箇所でも検出され、値が大きいと色の変化が大きな箇所でも検出されないことがあります。
実際に、いくつかパラメータを調整して試してみます。
このように、値を調整してエッジ検出を行っていきます。
その他のエッジ検出は以下のサイトを参考にしてください。
顔検出
顔検出とは名前の通り、画像にある人の顔を検出することです。
import cv2
import numpy as np
# 画像読み込み
img = cv2.imread(filename="lena_std.bmp")
# 顔検出
cascade = cv2.CascadeClassifier("haarcascade_frontalface_default.xmlのパス")
list = cascade.detectMultiScale(img)
# 検出箇所を四角で描画
if len(list):
for (x, y, w, h) in list:
cv2.rectangle(img=img, pt1=(x, y), pt2=(x+w, y+h),
color=(0, 0, 255), thickness=2)
# 画像書き込み
cv2.imwrite(filename="output.bmp", img=img)
Haar Cascadesを使った顔検出を使用します。
詳細は下記のサイトを参考にしてください。
OpenCVにはHaar Cascadesを用いた顔検出がデフォルトで使用できます。それがhaarcascade_frontalface_default.xmlというもので、私の場合は下記のパスにこのファイルがありました。
"C:\Users\**\AppData\Local\Programs\Python\Python311\Lib\site-packages\cv2\data"
プログラムの流れは以下の通りになります。
- 画像読み込み
- 顔検出を適用し、検出結果を取得する。
- 1つでも検出できた場合は、赤い四角で検出箇所を描画する。
今回はlistに検出結果が入っており、listは検出した座標と幅と高さが返ってきます。 - 画像書き込み
目の検出
目の検出は、顔検出ほぼ同じプログラムになります。
「haarcascade_frontalface_default.xml」を「haarcascade_eye.xml」に変えるだけです。
実行結果は以下の通りになります。
顔にモザイクをかけてみよう
ここまでの内容を組み合わせて、実際に簡単なソフトを作ってみます。
今回は、顔にモザイクをかけるものを作ってみます。
コードは以下の通りになります。
import cv2
import numpy as np
# 画像読み込み
img = cv2.imread(filename="./lena_std.bmp")
# 顔検出
cascade = cv2.CascadeClassifier("haarcascade_frontalface_default.xmlのパス")
list = cascade.detectMultiScale(img)
if len(list):
for (x, y, w, h) in list:
# 顔検出した箇所を切り抜く
cutout = img[y:y+h, x:x+w]
# 平滑化でぼかす
filter = cv2.blur(cutout, (25, 25))
# ぼかした箇所を上書きする
img[y:y+h, x:x+w] = filter
# 画像書き込み
cv2.imwrite(filename="output.bmp", img=img)
処理の流れは以下の通りになります。
- 画像読み込み
- 顔検出をかけて、顔の座標を取得する
- 取得できた数だけ4~6を繰り返す
- 顔検出した箇所を切り抜く
- 切り抜いた画像を平滑化でぼかす
- ぼかした箇所だけ入力画像を上書きする。
- 画像を書き込む
綺麗にぼかすことが出来ました。
最後に、別の画像で顔のぼかしと目のぼかしをやってみたいと思います。
使用する画像は下の画像になります。
まずは、顔をぼかします。
1カ所、誤検出されていますが、4人ともぼかすことが出来ました。
目だけぼかしてみましょう。
こちらは、残念ながら右の2人がぼかすことが出来ませんでした。
レナの画像に比べると、顔や目の大きさが小さいので、精度はその分落ちてしまいました。
まとめ
今回は、画像処理の実践的なものとして以下のものを紹介しました・
- 切り抜き
- 平滑化
- エッジ検出
- 顔検出
- 目の検出
紹介したものは一部の画像処理技術で、実際にはまだまだありますので、興味がある方は調べてみてください。
それでは、今回はここまでにしたいと思います。