OpenCVを使った画像処理の基礎を勉強していきます。
OpenCVを使用するので、細かい理論や1からの実装は行いません。
画像の読み込みと表示
何はともあれまずは画像を読み込み表示してみます。
読み込みはimread()、表示はmatplotlibのimshow()を使用します。
import cv2
import matplotlib.pyplot as plt
image_path = "./image.jpg" # 画像のパス
img = cv2.imread(image_path)
plt.imshow(img)
色が不自然に感じます。
ここで、読み込んだ画像のサイズを確認します。
numpyの配列同様に.shapeで表示できます。
img.shape
これは縦に2592pixel、横に4608pixel、チャンネル数が3であることを表しています。
3つの画像が重なっていると考えられますが、これが何を表しているか考えてみます。
カラー画像
まずは色の話をします。
複数の色の光を混ぜあわせることで別の色の光を作ることを混色と呼び、加法混色と減法混色があります。
加法混色では、異なる色の光を重ねて投影することで別の色を作るような混色で、通常R(赤)・G(緑)・B(青)の3色の光を使います。
PCのモニタなどの表示面は赤・緑・青の発光領域が細かく配置されています。
一方、減法混色では色付きのフィルタを通して白色項を見るような混色であり、C(シアン)・M(マゼンダ)・Y(イエロー)を原色とすることが多いです。
画像の話に移ります。
画素の位置の明るさのみを表す画像を、グレースケール画像と呼びます。白黒画像です。
加法混色を用いれば、赤・緑・青の3つの原色の量(画素値)を使えば、画像中のすべての位置ですべての色を表すことができます。
この画像中の位置に対応した赤・緑・青の3つの画素値を持つカラー画像を、RGBカラー画像と呼びます。
色の変換
今回はカラー画像を使用しているので、チャンネル数が3とは加法混色で使う3つの色の赤・緑・青を表していると予想できます。
実はOpenCVではimread()で読み込んだ画像は**青(B)・緑(G)・赤(R)**表示となっています。
これをRGB表示に直すにはcvtColor()でcv2.COLOR_RGB2BGRを指定します。
img_rgb = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
plt.imshow(img_rgb)
処理によってはグレー画像で十分である場合もあります。
その際はcv2.COLOR_BGR2GRAYを指定します。(RGBからはcv2.COLOR_RGB2GRAY)
img_gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
plt.imshow(img_gray, 'gray')
サイズを確認してみます。
img_gray.shape
チャンネル数が1になっていることが分かります。
画像のリサイズ・切り抜き
取得した画像はサイズが大きすぎたり、バラバラだったりするのでサイズを合わせる必要があります。
画像のリサイズではresize()で行います。
dsizeで変換後のサイズを指定します。
img_resize = cv2.resize(img_rgb, dsize=[200,120], fx=None, fy=None)
plt.imshow(img_resize)
print(img_resize.shape)
または、fx、fyで倍率を指定します。
img_resize = cv2.resize(img_rgb, dsize=None, fx=0.5, fy=0.5)
plt.imshow(img_resize)
print(img_resize.shape)
画像を大きくすることもできます。
interpolationに指定する補完方法としては以下のものがあります。
- cv2.INTER_NEAREST: 最近傍補間
- cv2.INTER_LINEAR: バイリニア補間
- cv2.INTER_CUBIC: バイキュービック補間
- cv2.INTER_AREA: ピクセル領域の関係を利用したリサンプリング
- cv2.INTER_LANCZOS4: Lanczos 補間
画像の切り抜きはnumpy配列同様にスライス機能を使用します。
img_clip = img_rgb[:2000,1000:3500,:]
plt.imshow(img_clip)
print(img_clip.shape)
これで画像を読み込んで、表示できるようになりました。
次からは画像処理の基礎をOpenCVを使って勉強していきます。
次回
画素ごとの濃淡変換
参考書籍
ディジタル画像処理[改訂第二版]