11
4

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 1 year has passed since last update.

LIGHTzAdvent Calendar 2022

Day 2

画像と周波数領域と1/fゆらぎとsaliency

Posted at

はじめに

この記事は、LIGHTzアドベントカレンダー2022の2日目の記事です。

@KTasknこと、たすく、です。
LIGHTzは業務に支障がでない範囲で自由な働き方ができる風土が整っています。
私は現在、そんな弊社で働きながら大学院のの修士1回生(2年目(!?))として、データサイエンス・コンピュータビジョンの研究に励んでいます。

というのは,去年のアドベントカレンダーの書き出しをそのままコピってきたのですが,

今年のアドベントカレンダーでは,そのコンピュータビジョンを研究・勉強するうえで,おもしろかった内容を投稿していきたいと思っています.

画像のフーリエ変換

みなさん,フーリエ変換はしたことありますか?毎日していますか?
関数を周波数領域に変換するアレです.フーリエ変換だけで教科書一冊ある奥の深そうな話なのでその話はすみませんが割愛します.
ウィキペディアの周波数領域の記事に記載の記事がとてもわかりやすい.

いろいろな関数は,単純な波の足し合わせで表現できるんですね.

Fourier_transform_time_and_frequency_domains_(small).gif

上の例だと,1次元な値なんですが,実は2次元の画像でも同じことができるというのが今回のお話でして,
下の画像は私が昨夜ぽちぽちとドット絵エディタで打ったMegamanのドット絵になります.これだって実は波の足し合わせで表せるんですよ.
megaman

二次元の波ってなんじゃという話なんですが,上の画像を構成する波が下の画像ら(抜粋).(幅,高さ)=(32,32)の画像なら32x32=1024の波の足し合わせで表現されます.

波図.png

PythonとOpenCVを使うと下記のコードで確認することができます.

# jupyter notebook
from PIL import Image
import numpy as np
import cv2
import matplotlib.pyplot as plt

# 画像を開いて,グレースケールにする
a_image = Image.open("megaman.png").convert("L")
# 画像を表示
display(a_image)

# 高速フーリエ変換する
fimage = np.fft.fft2(a_image)

# 周波数領域を描画
display(Image.fromarray(np.uint8(np.abs(fimage))))

images = []
for i in range(32):
    for j in range(32):
        # 周波数ごとに波形をとりだす
        # 0で初期化した周波数行列を作成する
        d_fimage = np.zeros((32, 32), dtype=complex)
        # 周波数帯 i, j をとりだし,行列に埋め込む
        d_fimage[j, i] = fimage[j, i]
        # 周波数領域 -> 時間領域(画像)に変換する
        d_ifimage = np.fft.ifft2(d_fimage)
        # 表示する
        display(Image.fromarray(np.uint8(d_ifimage)))
        # あとで足し合わせるためにリストに保存しておく
        images.append(d_ifimage)

# リストに保存した波の画像を足し合わせて表示する
display(Image.fromarray(np.uint8(np.abs(np.sum(images, axis=0)))))

# 時間領域に再変換
ifimage = np.fft.ifft2(fimage).real
display(Image.fromarray(np.uint8(ifimage)))

風景と被写体と,周波数領域と1/fゆらぎ

そんな周波数領域なのですが,不思議なことに自然な写真だと,周波数とパワーが綺麗に反比例することが知られており,世の中で$\frac{1}{f}$なんていわれる法則に従います.下の画像だと,オレンジ色の線が実際の周波数に対するパワーの値で,青い線が$\frac{1}{f}$のガイドになります.かなり線にのっかっているのがわかります.
image.png

風景写真だとガイドに対して上振れにする傾向になります.
image.png

image.png

逆に接写だと下振れの傾向になります
image.png

image.png

被写体と風景の割合がちょうどバランスされたなんともなしな写真の場合,綺麗に青線にのります.
image.png

image.png

saliency

そんな周波数領域を使って,写真にうつっている重要な領域をとりだせないかという論文がありまして,$\frac{1}{f}$の領域が自然な領域なら,$\frac{1}{f}$以外の部分をとりだせば,それは写真の中で重要な物体なんじゃないかという技術がございます.

HOU, Xiaodi; ZHANG, Liqing. Saliency detection: A spectral residual approach. In: 2007 IEEE Conference on computer vision and pattern recognition. Ieee, 2007. p. 1-8.

image.png

image.png

image.png

image.png

image.png

image.png

上2つの風景写真ぽいのではうまくいっている気がしますね.接写写真だと微妙な感じです.牛の画像はサッパリですが,ネコの方はうまくいっている気がします.

image.png

二条城なんかはかなりうまくいっている感じになりました.

11
4
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
11
4

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?