More than 1 year has passed since last update.

Databricks Advent Calendar 2022

@taka_yayoi(Takaaki Yayoi)in

データブリックス・ジャパン株式会社

今さら聞けない画像処理

Last updated at 2024-05-13Posted at 2022-10-09

こちらのイベントで説明した内容の抜粋です。

ウェビナーで使用したノートブックはこちらにあります。

スライドはこちら。

画像処理とは

我々が日常的に目にする画像をコンピューターで処理する技術です。

画像処理とは、主にコンピュータを使用して、画像を変形したり、色合いを変えたり、別の画像と合成したり、画像から何らかの情報を取り出す等の処理を指します。
そして、近年では、コンピュータが画像の内容を理解し、情報の抽出やデータ化を行う画像解析の適用も進んでいます。

画像解析とは

画像から被写体の形状、色、サイズなどを抽出する技術です。

画像データの増加による画像データ活用の可能性の拡大、機械学習、人工知能技術
の進展により、コンピュータを用いて、画像データから人、顔、自動車、部品などを抽出し、その形状、色などを判定することで、異常行動の検知、認証、品質チェックを行うという取り組みが増えています。対象は画像だけではなく、動画にも拡大しています。
最近ではMidjourneyなどによる画像生成も流行り始めていますが、今回は割愛します。

画像解析の適用事例

もはや画像解析は実験段階ではなく実運用されるレベルになっています。

JOHN DEERE

コンバインによって収穫される穀物をカメラで継続的にモニタリング。
穀物にダメージが認められた場合には、自動的に機械の制御パラメーターを調整。

wehkamp

eコマースサイトに掲載する服の形状を検出し、自動で背景を除去。
背景画像を統一することで、サイトの一貫性を確保。

デジタル病理学(digital pathology)

画像処理技術の進展と新たな効率的な計算ツールの出現により、デジタル病理学は研究、診断の両方において中心的な位置を占めるように。
癌や感染症を診断し、治療する際の効率・効果を改善。

画像解析でできること

画像解析によって人間の目、あるいはそれ以上の能力を活用できます。

物体検知
画像・映像内の特定の物体を検知することで、個数カウント、サイズ測定、不良品検知などをおこないます。

パターン検知
X線画像から腫瘍のパターンを検知することで、病状の早期検知につなげます。

顔認識
スマートフォンでも広く用いられており、新たな認証手法として確立されています。

文字認識
画像上の文字を認識し、翻訳を行うことがごく自然に行われています。

類似画像検索
画像の形状などから類似性を算出し、似ている画像を検索します。

画像処理ウォークスルー

ここではコンピュータビジョンのライブラリOpenCVを使用します。以降のウォークスルーで使用したノートブックはこちらにあります。

グレースケール変換
カラー画像をグレースケールに変換します。

エッジ検出
画像の輪郭を検出します。

サイズ変更
画像サイズを変更します。

こちらのノートブックを使用しました。

Python

import matplotlib.pyplot as plt
import cv2
import numpy as np

Databricksの環境にあるサンプル画像を使用します。

Python

target = cv2.imread('/dbfs/databricks-datasets/cctvVideos/train_images/label=0/LeftBagframe0004.jpg', cv2.IMREAD_UNCHANGED)

# 画像の表示
plt.imshow(cv2.cvtColor(target, cv2.COLOR_BGR2RGB)) # OpenCV は色がGBR順なのでRGB順に並べ替える
plt.show()

グレースケール

カラー画像を白黒の階調で表現する様にします。

Python

# imreadの第二引数でグレースケールを指定
gry = cv2.imread('/dbfs/databricks-datasets/cctvVideos/train_images/label=0/LeftBagframe0004.jpg', cv2.IMREAD_GRAYSCALE)
#imshow(gry)
cv2.imwrite('/tmp/gray.jpg', gry)

# 画像の表示
plt.imshow(cv2.cvtColor(gry, cv2.COLOR_BGR2RGB)) # OpenCV は色がGBR順なのでRGB順に並べ替える
plt.show()

エッジ検出

輪郭を検出して強調表示します。

Python

# エッジ検出
canny_img = cv2.Canny(target, 50, 110)

# 画像の表示
plt.imshow(cv2.cvtColor(canny_img, cv2.COLOR_BGR2RGB)) # OpenCV は色がGBR順なのでRGB順に並べ替える
plt.show()

サイズ変更

Python

# 画像の高さ幅を指定
width,height = 60, 60
# 画像をリサイズ
resized_img = cv2.resize(target, (width, height))

# 画像の表示
plt.imshow(cv2.cvtColor(resized_img, cv2.COLOR_BGR2RGB)) # OpenCV は色がGBR順なのでRGB順に並べ替える
plt.show()

画像解析ウォークスルー

Databricksにおける画像の取り扱いから画像解析の例を説明します。ウェビナーでは以下のユースケースのノートブックをウォークスルーしました。

画像データの取り扱いおよび画像のラベリング
画像解析を行う際の基本的な流れを説明します。

物体検知
画像・映像内の特定の物体を検知することで、個数カウント、サイズ測定、不良品検知などをおこないます。

パターン検知
X線画像から腫瘍のパターンを検知することで、病状の早期検知につなげます。

類似画像検索
服や靴の画像を入力として、類似する画像を抽出します。

こちらでは物体検知のノートブックを説明します。

注意
使用しているImageAIのバージョンの関係からランタイムは7.3MLを使用してください。

セットアップ

ImageAI:の一部である事前学習済みモデルを追加するためにインストールを行います。

ImageAI: ImageAI本体
Yolo V3: You only look once (YOLO)は最先端のリアルタイム物体検知システムです。ここではYOLOv3: An Incremental Improvementに記載されているV3を使用します。これは画像向けのモデルです。
Resnet: 特徴量抽出のためにResidual Network model(h5 formatフォーマット)を使用します。このモデルは動画向けです。

ImageAIのインストール

%pip install tensorflow==2.4.1
%pip install keras==2.5.0rc0

%pip install imageai

ファイルパスの設定

このノートブックではユーザー名に基づいてファイル格納パスを設定します。以下のパスを使用します。

/tmp/20210902_workshop/<ユーザー名>/: 検知対象データ、検出結果などを保存
/FileStore/tmp/20210902_workshop/<ユーザー名>/: 検出結果参照用

Python

import re
from pyspark.sql.types import * 

# ログインIDからUsernameを取得
username_raw = dbutils.notebook.entry_point.getDbutils().notebook().getContext().tags().apply('user')
# Username の英数字以外を除去し、全て小文字化。Username をファイルパスやデータベース名の一部で使用可能にするため。
username = re.sub('[^A-Za-z0-9]+', '', username_raw).lower()

# DBFS上のファイル格納パス
work_path = f"/tmp/20210902_workshop/{username}/"

# パスをシェル環境変数に設定して、シェルコマンドから参照できるようにします
import os
os.environ['work_path'] = work_path

print("path: " + work_path)

検知対象ファイルのダウンロード

シェルでwgetを使用して画像ファイルをダウンロードします。

%sh
wget -P /dbfs${work_path} https://sajpstorage.blob.core.windows.net/workshop20210615-object-detection/five_drinks.jpg

学習済みモデルのダウンロード

Yoloをダウンロードします。

%sh
## Install the ImageAI pre-trained models: YoloV3, ResNet
wget -P /dbfs$work_path https://github.com/OlafenwaMoses/ImageAI/releases/download/1.0/yolo.h5

Python

# ダウンロードされていることを確認します
display(dbutils.fs.ls(work_path))

Python

## ------------------------------
## ユーティリティ関数
## ------------------------------
# displayVid(): クラウドストレージ上の動画を表示
def displayVid(filepath):
  return displayHTML("""
  <video width="480" height="320" controls>
  <source src="/files/%s" type="video/mp4">
  </video>
  """ % filepath)

# displayDbfsVid(): DBFSの動画を表示
def displayDbfsVid(filepath):
  return displayHTML("""
  <video width="480" height="320" controls>
  <source src="/dbfs/%s" type="video/mp4">
  </video>
  """ % filepath)

# displayImg(): DBFS/クラウドストレージの動画を表示
def displayImg(filepath):
  dbutils.fs.cp(filepath, "FileStore/%s" % filepath)
  return displayHTML("""
  <img src="/files/%s" width="800">
  """ % filepath)

単一画像からコーヒーの検知

YoloV3と以下のスターバックスのアイスコーヒーの画像を用いて物体検知を行います。

Python

# TensorFlowの設定
import tensorflow as tf

config = tf.compat.v1.ConfigProto()
config.gpu_options.visible_device_list = "0"
config.gpu_options.allow_growth = True
config.gpu_options.per_process_gpu_memory_fraction = 0.5

tf.compat.v1.Session(config=config)
tf.compat.v1.set_random_seed(42) # 再現性確保のために乱数のシードを設定

Python

# ImageAIからObjectDetectionをインポート
from imageai.Detection import ObjectDetection
import os
import h5py

# 実行パス、分析画像、出力先のパスを指定
execution_path = f"/dbfs{work_path}"
execution_path_source = f"/dbfs{work_path}five_drinks.jpg"
execution_path_results = f"/dbfs{work_path}result.jpg"

print(execution_path)
print(execution_path_source)
print(execution_path_results)

物体検知

Python

# YoloV3モデルとObjectDetectionを使用
detector = ObjectDetection()
detector.setModelTypeAsYOLOv3()
detector.setModelPath( os.path.join(execution_path , "yolo.h5"))
detector.loadModel()

detections = detector.detectObjectsFromImage(
  input_image = execution_path_source, # 検知対象画像パス
  output_image_path = execution_path_results, # 検知結果画像パス
  minimum_percentage_probability = 30 # 確率の閾値
)

検知結果を確認します。

Python

detections

領域とラベルのセットが得られています。

dining tableの確率は30%程度ですが、他のcupに関しては60-90%程度の確率となっています。
percentage_probabilityの後に表示されているのは検知箇所の座標です。

検知結果がオーバーレイされた画像を表示します。

まとめ

ウェビナーでは、これ以外にもデジタル病理学の実例、TensorFlow Similarityを用いた類似画像の取得、アプリとの連携までをご紹介しました。画像処理よりも画像解析に重きを置いた内容となりましたが、これらすべては実験段階の域を超え、すでにビジネスで広く活用されている技術となっています。皆様も街中で画像解析が活用されている事例は結構見かけているはずです。

このような画像解析技術をクイックに試すことができ、実運用段階に容易にこうする仕組みを提供しているDatabricksを活用してみませんか？

以下はDatabricksが提供している機能のごく一部です。

並列分散処理による画像の高速処理
GPUクラスターを簡単に構成して活用
様々なライブラリのサポート
モデル管理からデプロイまでをカバーするMLOpsの実現

DatabricksのセミナーなのでDatabricksの宣伝になってしまいました。

Databricksでどの様に画像を活用できるのかに興味がある方は、以下の記事もご覧ください。

その他の「今さら聞けない」シリーズ

Databricks 無料トライアル

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up