はじめに
連休を楽しむために、宿題を片付けよう。
目次
OpenCVでスプライトを半透明にする #1 ~おばけを出現させる~
OpenCVでスプライトを半透明にする #2 ~グラデーションな半透明を作る~ ←今ここ
行列の計算をnumpyでおこなう
まず、前回の関数を再掲する。関数だけなのでこれだけでは動かないことに注意。
import cv2
def sprite_alpha(back, front4, alpha):
front = front4[:, :, :3] # RGB(3ch)
mask = front4[:, :, 3] # A要素(1ch)
mask = cv2.merge((mask, mask, mask)) # 3chにする
# 全体を合成
compo = cv2.addWeighted(front, alpha, back, 1-alpha, 0)
# マスク処理
compo_with_mask = cv2.bitwise_and(compo, mask)
back_with_mask = cv2.bitwise_and(back, 255-mask)
# 必要に応じて有効化してください
# cv2.imshow("compo", compo)
# cv2.imshow("mask", mask)
# cv2.imshow("255-mask", 255-mask)
# cv2.imshow("compo_with_mask", compo_with_mask)
# cv2.imshow("back_with_mask", back_with_mask)
# 完成形
result = compo_with_mask + back_with_mask
return result
さて、これまでの記事ではマスク処理でcv2.bitwise_and()
を使った。
だが、自分でも気づかぬうちにより汎用的な方法を思いついていた。この記事で。
同サイズの二つの行列の要素ごとの積を計算するアダマール積。これがマスクとして使える(使っている)ことに当時は気づいていなかったわけだ。
さらに、前回、cv2.AddWeighted(src1, alpha, src2, beta, gamma)
が alpha * src1 + beta * src2 + gamma
という行列の計算をしていると述べた。
つまり、cv2.bitwise_and()
やcv2.AddWeighted()
を使わず、行列の計算式で上の関数を書き直すことができるというわけだ。
ついでにcv2.merge()
もnumpy関数に変えちゃえ。
import cv2
import numpy as np
def sprite_alpha_np(back, front4, alpha):
front = front4[:, :, :3] # RGB(3ch)
mask = front4[:, :, 3] # A要素(1ch)
mask = np.dstack((mask, mask, mask)) # 3chにする
# 全体を合成
compo = (alpha * front + (1-alpha) * back).astype(np.uint8)
# マスク処理
compo_with_mask = (1/255 * compo * mask).astype(np.uint8)
back_with_mask = (1/255 * back * (255-mask)).astype(np.uint8)
# 必要に応じて有効化してください
# cv2.imshow("compo", compo)
# cv2.imshow("mask", mask)
# cv2.imshow("255-mask", 255-mask)
# cv2.imshow("compo_with_mask", compo_with_mask)
# cv2.imshow("back_with_mask", back_with_mask)
# 完成形
result = compo_with_mask + back_with_mask
return result
0~255の値を持つ行列要素同士の積なので、計算結果は0~65535…じゃないや0~65025の値を取りうる。アダマール積の行列のデータ型は元の行列と同じくuint8で0~255の値が格納される。これでは正しい画像として表示することができない。
そこで最初に255で割って0.0~255.0の小数行列にして、それをuint8に変換している。
マスクを0.0~1.0の小数の行列として扱う
マスクの行列を255で割って0.0~1.0の小数の行列にすれば都度255で割る必要はなくなる。
これでコードがかなりシンプルになることだろう。
ただしこの状態だと先程と同様、画像が0.0~255.0の小数値になってしまう。
だからマスクだけでなく画像の行列も255で割ってしまおう。そうすれば計算結果も0.0~1.0の小数値の行列になる。
こういうも正規化というのかな。
cv2.imshow()
は0~255の整数行列だけでなく0.0~1.0の小数行列でも正しく表示できる。だから途中の確認は問題ない。ただし0.0~1.0の小数値の行列ではcv2.imwrite()
で画像を保存できないので注意。
後でどう使われるかわからないので、関数の戻り値だけはこれまで通り255をかけてuint8にしておこう。
import cv2
import numpy as np
def sprite_alpha_norm(back, front4, alpha):
front = 1 /255 * front4[:, :, :3] # RGB(3ch)0~1の小数値
mask = 1 / 255 * front4[:, :, 3] # A要素(1ch)0~1の小数値
mask = np.dstack((mask, mask, mask)) # 3chにする
back = 1 / 255 * back # 背景も0~1の小数値にする
# 全体を合成
compo = alpha * front + (1-alpha) * back
# マスク処理
compo_with_mask = compo * mask
back_with_mask = back * (1-mask)
# 必要に応じて有効化してください
# cv2.imshow("compo", compo)
# cv2.imshow("mask", mask)
# cv2.imshow("1-mask", 1-mask)
# cv2.imshow("compo_with_mask", compo_with_mask)
# cv2.imshow("back_with_mask", back_with_mask)
# 完成形
result = (255*(compo_with_mask + back_with_mask)).astype(np.uint8)
return result
アルファ値とマスクを合成する
必須ではないが、アルファ値とマスクを合成しておきたい。つまり、これを作りたい。
計算は alpha * mask
、スカラーと行列の乗算をするだけ。
前景部分は半透明 背景を消すマスク |
---|
このマスクを使うと、これまでとは違う中間画像が得られる。
もちろん完成形は同じ。ただの私のこだわりだ。
前回
前景部分は合成 背景部分は黒 |
前景部分は黒 背景部分はそのまま |
→ | 完成形 |
---|---|---|---|
→ |
今回
前景部分は半透明 背景部分は黒 |
前景部分は半透明 背景部分はそのまま |
→ | 完成形 |
---|---|---|---|
→ |
グラデーションな半透明を作る
スカラーのアルファ値とマスク行列を同等に扱うことができるようになった。
cv2.addWeighted()
では重みはスカラー値でしか指定できなかったが、行列を重みとして指定することができるようになった。
次は一つの画像の中でアルファ値が変化しているこんな画像を目指す。
完成形 |
---|
グラデーション画像を作る
まず、グラデーション画像を作る関数を考えておく。
import cv2
import numpy as np
import math
def make_grad(height, width):
grad = np.empty((height, width, 3), np.uint8)
for h in range(height):
value = int(255 * (1 - math.cos(2*math.pi*h/height)) / 2) # 0~255の正弦波
grad[h, :] = value
return grad
front4 = cv2.imread("ghost.png", -1)
height, width = front4.shape[:2]
grad = make_grad(height, width)
cv2.imshow("grad", grad)
cv2.waitKey(0)
cv2.destroyAllWindows()
前景 | 同サイズの グラデーション |
---|---|
グラデーションなマスクを作る
先ほどアルファ値とマスクを合成したが、同じやり方でグラデーションとマスクを合成する。
numpyではスカラーと行列の乗算はk * A
と書き、行列の要素ごとの積はA * B
と書く。つまりスカラーも行列も計算は同じだ。
前景を残し 背景を消すマスク |
グラデーション | → | 前景がグラデーションで 背景を消すマスク |
---|---|---|---|
→ |
ここまで作れば後は同じなのだが、せっかくなので中間画像を置いておく。
前景にマスク処理するとこうなる。
前景 | マスク | → | 前景部分は半透明 背景は黒 |
---|---|---|---|
→ |
また、背景にマスク(をネガポジ反転したもの)を適用させるとこうなる。
背景 | マスク反転 | → | 前景部分は半透明 背景は残る |
---|---|---|---|
→ |
二つの中間画像を合体すればグラデーションな半透明を持つ画像の合成のできあがりだ。
前景部分は半透明 背景部分は黒 |
前景部分は半透明 背景部分はそのまま |
→ | 完成形 |
---|---|---|---|
→ |
ソース
ここまで理解のために中間画像を変数に格納して表示してきたが、実際はalpha * src1 + beta * src2 + gamma
で一発で計算できるので、本番では中間画像を作らない仕様とした。
せっかくなのでグラデーションが動くサンプルを示す。
アニメGIF |
---|
ソースコード(折りたたみ)
import cv2
import numpy as np
import math
def make_grad(height, width):
grad = np.empty((height, width, 3), np.uint8)
for h in range(height):
value = int(255 * (1 - math.cos(2*math.pi*h/height)) / 2) # 0~255の正弦波
grad[h, :] = value
return grad
def sprite_grad(back, front4, grad):
front = 1 /255 * front4[:, :, :3] # RGB(3ch)0.0~1.0の小数値
mask = 1 / 255 * front4[:, :, 3] # A要素(1ch)0.0~1.0の小数値
mask = np.dstack((mask, mask, mask)) # 3chにする
back = 1 / 255 * back # 背景も0.0~1.0の小数値にする
grad = 1 / 255 * grad # グラデーションも0.0~1.0の小数値にする
grad_mask = grad * mask # 前景マスクとグラデーションを合成する
compo = grad_mask * front + (1 - grad_mask) * back # cv2.AddWeighted()に相当する計算
result = (255 * compo).astype(np.uint8) # 0~255の整数値にする
return result
# 前景
front_RGBA = cv2.imread("ghost.png", -1) # 4ch
# 背景
back_origin = cv2.imread("background.png") # 背景画像
height, width = front_RGBA.shape[:2]
x, y = 200, 200
back = back_origin[y:y+height, x:x+width] # 前景と同サイズの背景
# グラデーション
grad = make_grad(height, width)
while True:
image = sprite_grad(back, front_RGBA, grad)
cv2.imshow("image", image)
if cv2.waitKey(10) == 27:
break
grad = np.roll(grad, 1, axis=0)
cv2.destroyAllWindows()
終わりに
0~255の整数値で計算したり、0.0~1.0の小数値で計算したり。
OpenCVの関数を使ったり、numpyの関数を使ったり。
いろいろな方法で実装できたが、結局どれが一番速いのか。
次回は処理速度の検証をします。