More than 1 year has passed since last update.

OpenCVでスプライトを半透明にする #2　～グラデーションな半透明を作る～

Posted at 2024-04-28

はじめに

連休を楽しむために、宿題を片付けよう。

行列の計算をnumpyでおこなう

まず、前回の関数を再掲する。関数だけなのでこれだけでは動かないことに注意。

sprite_alpha( )

import cv2

def sprite_alpha(back, front4, alpha):
    front = front4[:, :, :3]                        # RGB（3ch）
    mask = front4[:, :, 3]                          # A要素（1ch）
    mask = cv2.merge((mask, mask, mask))            # 3chにする

    # 全体を合成
    compo = cv2.addWeighted(front, alpha, back, 1-alpha, 0)
    # マスク処理
    compo_with_mask = cv2.bitwise_and(compo, mask)
    back_with_mask = cv2.bitwise_and(back, 255-mask)

    # 必要に応じて有効化してください
    # cv2.imshow("compo", compo)
    # cv2.imshow("mask", mask)
    # cv2.imshow("255-mask", 255-mask)
    # cv2.imshow("compo_with_mask", compo_with_mask)
    # cv2.imshow("back_with_mask", back_with_mask)

    # 完成形
    result = compo_with_mask + back_with_mask
    return result

さて、これまでの記事ではマスク処理でcv2.bitwise_and()を使った。
だが、自分でも気づかぬうちにより汎用的な方法を思いついていた。この記事で。

同サイズの二つの行列の要素ごとの積を計算するアダマール積。これがマスクとして使える（使っている）ことに当時は気づいていなかったわけだ。

さらに、前回、cv2.AddWeighted(src1, alpha, src2, beta, gamma) が alpha * src1 + beta * src2 + gamma という行列の計算をしていると述べた。

つまり、cv2.bitwise_and()やcv2.AddWeighted()を使わず、行列の計算式で上の関数を書き直すことができるというわけだ。
ついでにcv2.merge()もnumpy関数に変えちゃえ。

OpenCVの関数を使わない方法　sprite_alpha_np( )

import cv2
import numpy as np

def sprite_alpha_np(back, front4, alpha):
    front = front4[:, :, :3]                        # RGB（3ch）
    mask = front4[:, :, 3]                          # A要素（1ch）
    mask = np.dstack((mask, mask, mask))            # 3chにする

    # 全体を合成
    compo = (alpha * front + (1-alpha) * back).astype(np.uint8)
    # マスク処理
    compo_with_mask = (1/255 * compo * mask).astype(np.uint8)
    back_with_mask = (1/255 * back * (255-mask)).astype(np.uint8)

    # 必要に応じて有効化してください
    # cv2.imshow("compo", compo)
    # cv2.imshow("mask", mask)
    # cv2.imshow("255-mask", 255-mask)
    # cv2.imshow("compo_with_mask", compo_with_mask)
    # cv2.imshow("back_with_mask", back_with_mask)

    # 完成形
    result = compo_with_mask + back_with_mask
    return result

0~255の値を持つ行列要素同士の積なので、計算結果は0~65535…じゃないや0～65025の値を取りうる。アダマール積の行列のデータ型は元の行列と同じくuint8で0~255の値が格納される。これでは正しい画像として表示することができない。
そこで最初に255で割って0.0~255.0の小数行列にして、それをuint8に変換している。

マスクを0.0~1.0の小数の行列として扱う

マスクの行列を255で割って0.0~1.0の小数の行列にすれば都度255で割る必要はなくなる。
これでコードがかなりシンプルになることだろう。
ただしこの状態だと先程と同様、画像が0.0~255.0の小数値になってしまう。

だからマスクだけでなく画像の行列も255で割ってしまおう。そうすれば計算結果も0.0~1.0の小数値の行列になる。
こういうも正規化というのかな。

cv2.imshow()は0~255の整数行列だけでなく0.0~1.0の小数行列でも正しく表示できる。だから途中の確認は問題ない。ただし0.0~1.0の小数値の行列ではcv2.imwrite()で画像を保存できないので注意。

後でどう使われるかわからないので、関数の戻り値だけはこれまで通り255をかけてuint8にしておこう。

0~1の小数の行列で計算する方法　sprite_alpha_norm( )

import cv2
import numpy as np

def sprite_alpha_norm(back, front4, alpha):
    front = 1 /255 * front4[:, :, :3]               # RGB（3ch）0~1の小数値
    mask = 1 / 255 * front4[:, :, 3]                # A要素（1ch）0~1の小数値
    mask = np.dstack((mask, mask, mask))            # 3chにする
    back = 1 / 255 * back                           # 背景も0~1の小数値にする

    # 全体を合成
    compo = alpha * front + (1-alpha) * back
    # マスク処理
    compo_with_mask = compo * mask
    back_with_mask = back * (1-mask)

    # 必要に応じて有効化してください
    # cv2.imshow("compo", compo)
    # cv2.imshow("mask", mask)
    # cv2.imshow("1-mask", 1-mask)
    # cv2.imshow("compo_with_mask", compo_with_mask)
    # cv2.imshow("back_with_mask", back_with_mask)

    # 完成形
    result = (255*(compo_with_mask + back_with_mask)).astype(np.uint8)
    return result

アルファ値とマスクを合成する

必須ではないが、アルファ値とマスクを合成しておきたい。つまり、これを作りたい。
計算は alpha * mask、スカラーと行列の乗算をするだけ。

前景部分は半透明背景を消すマスク

このマスクを使うと、これまでとは違う中間画像が得られる。
もちろん完成形は同じ。ただの私のこだわりだ。

前回

前景部分は合成背景部分は黒	前景部分は黒背景部分はそのまま	→	完成形
		→

今回

前景部分は半透明背景部分は黒	前景部分は半透明背景部分はそのまま	→	完成形
		→

グラデーションな半透明を作る

スカラーのアルファ値とマスク行列を同等に扱うことができるようになった。
cv2.addWeighted()では重みはスカラー値でしか指定できなかったが、行列を重みとして指定することができるようになった。

次は一つの画像の中でアルファ値が変化しているこんな画像を目指す。

完成形

グラデーション画像を作る

まず、グラデーション画像を作る関数を考えておく。

make_grad( )

import cv2
import numpy as np
import math

def make_grad(height, width):
    grad = np.empty((height, width, 3), np.uint8)
    for h in range(height):
        value = int(255 * (1 - math.cos(2*math.pi*h/height)) / 2)   # 0~255の正弦波
        grad[h, :] = value
    return grad

front4 = cv2.imread("ghost.png", -1)
height, width = front4.shape[:2]
grad = make_grad(height, width)
cv2.imshow("grad", grad)
cv2.waitKey(0)
cv2.destroyAllWindows()

前景	同サイズのグラデーション

グラデーションなマスクを作る

先ほどアルファ値とマスクを合成したが、同じやり方でグラデーションとマスクを合成する。
numpyではスカラーと行列の乗算はk * Aと書き、行列の要素ごとの積はA * Bと書く。つまりスカラーも行列も計算は同じだ。

前景を残し背景を消すマスク	グラデーション	→	前景がｸﾞﾗﾃﾞｰｼｮﾝで背景を消すマスク
		→

ここまで作れば後は同じなのだが、せっかくなので中間画像を置いておく。
前景にマスク処理するとこうなる。

前景	マスク	→	前景部分は半透明背景は黒
		→

また、背景にマスク（をネガポジ反転したもの）を適用させるとこうなる。

背景	マスク反転	→	前景部分は半透明背景は残る
		→

二つの中間画像を合体すればグラデーションな半透明を持つ画像の合成のできあがりだ。

前景部分は半透明背景部分は黒	前景部分は半透明背景部分はそのまま	→	完成形
		→

ソース

ここまで理解のために中間画像を変数に格納して表示してきたが、実際はalpha * src1 + beta * src2 + gamma で一発で計算できるので、本番では中間画像を作らない仕様とした。
せっかくなのでグラデーションが動くサンプルを示す。

アニメGIF

ソースコード（折りたたみ）

import cv2
import numpy as np
import math

def make_grad(height, width):
    grad = np.empty((height, width, 3), np.uint8)
    for h in range(height):
        value = int(255 * (1 - math.cos(2*math.pi*h/height)) / 2)   # 0~255の正弦波
        grad[h, :] = value
    return grad


def sprite_grad(back, front4, grad):
    front = 1 /255 * front4[:, :, :3]               # RGB（3ch）0.0~1.0の小数値
    mask = 1 / 255 * front4[:, :, 3]                # A要素（1ch）0.0~1.0の小数値
    mask = np.dstack((mask, mask, mask))            # 3chにする
    back = 1 / 255 * back                           # 背景も0.0~1.0の小数値にする
    grad = 1 / 255 * grad                           # グラデーションも0.0～1.0の小数値にする

    grad_mask = grad * mask                         # 前景マスクとグラデーションを合成する
    compo = grad_mask * front + (1 - grad_mask) * back  # cv2.AddWeighted()に相当する計算
    result = (255 * compo).astype(np.uint8)         # 0～255の整数値にする
    return result


# 前景
front_RGBA = cv2.imread("ghost.png", -1)        # 4ch

# 背景
back_origin = cv2.imread("background.png")      # 背景画像
height, width = front_RGBA.shape[:2]
x, y = 200, 200
back = back_origin[y:y+height, x:x+width]       # 前景と同サイズの背景

# グラデーション
grad = make_grad(height, width)

while True:
    image = sprite_grad(back, front_RGBA, grad)
    cv2.imshow("image", image)
    if cv2.waitKey(10) == 27:
        break
    grad = np.roll(grad, 1, axis=0)
cv2.destroyAllWindows()

終わりに

0～255の整数値で計算したり、0.0～1.0の小数値で計算したり。
OpenCVの関数を使ったり、numpyの関数を使ったり。
いろいろな方法で実装できたが、結局どれが一番速いのか。
次回は処理速度の検証をします。

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up

OpenCVでスプライトを半透明にする #2 ～グラデーションな半透明を作る～