More than 5 years have passed since last update.

Python・OpenCVでバイナリデータを扱う場合

Last updated at 2018-01-14Posted at 2018-01-14

やりたいこと

バイナリデータから cv2.imread と同じ結果を得たい。

例えば、次のようなケースを想定。

PDFファイルをバイナリモードで開く
PDFデータ内から画像部分のバリナリデータを抜き取る
バイナリデータを画像としてOpenCVで扱う

※一般的なPDFのライブラリを使用せず、最低限の解析処理でPDFデータを扱ってみたいため

背景

Pythonについては初心者な人間が、1ヶ月程前にOpenCVにて画像解析に手を付け始めて2,3日やったものの、それから1ヶ月手付かずの状況でふと再開しました。
これまではファイル保存していた画像を扱っていましたが、OpenCVでの処理を行なう前段階で、画像がバイナリデータの状態の時に、どのようにデータを扱うかがわからず、あれこれ調べた結果をまとめました。

考えた事ややったこと

メモリストリームにして、ストリーム形式が扱えるメソッドに渡せばいいだろうと考えました。
しかし、OpenCVにそのようなメソッドがあるのかがわからず、適当に検索を進めます。
そして、ほぼ答えの載った内容を見つけたので、実際に試してみて足りない部分を補うような形となったのが次の結論です。

とりあえずの結論

import cv2
import numpy as np
import io
from PIL import Image

### ここはコメントをもらうまえのコード（※closeし忘れていた）
### filename = "test.png"
### img_binary = open(filename, "rb").read()

# バイナリデータを準備するのにファイル読込を行なう（テスト用なのでファイル名も直接指定）
# なお、実際には前段階でバイナリデータが渡されることを想定している
with open("test.png", 'rb') as f:
    img_binary = f.read()

# 想定する処理はここから --------------------

# バイナリーストリーム <- バリナリデータ
img_binarystream = io.BytesIO(img_binary)

# PILイメージ <- バイナリーストリーム
img_pil = Image.open(img_binarystream)
print(img_pil.mode) #この段階だとRGBA

# numpy配列(RGBA) <- PILイメージ
img_numpy = np.asarray(img_pil)

# numpy配列(BGR) <- numpy配列(RGBA)
img_numpy_bgr = cv2.cvtColor(img_numpy, cv2.COLOR_RGBA2BGR)

# 表示確認
cv2.imshow('window title', img_numpy_bgr)
cv2.waitKey(0)
cv2.destroyAllWindows()

今後

もっとよいやり方がわかったら追記したいと思います。
未だにPythonの構文にも慣れておらず、入出力もどうなっているのか把握できていないレベルですので・・・

以上

参考にしたもの

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up