以前、世界の料理の配色割合を調べていた時に画像から料理を抽出する作業が必要となったことがあった。
今回はその料理抽出作業をライブラリ化したので使い方をまとめてみた。
もし利用できそうな機会があれば是非利用してみて欲しい。
料理抽出作業とは
この記事で言う料理抽出作業とは一枚の料理画像から料理以外の要素をできるだけ排除し料理部分を残す作業のことである。 ↑ 料理抽出作業前画像 上の画像から料理部分だけを抽出し(背景などを削除したい)、下の画像のように背景など不要な部分を透明化させることを目的としている。↑ 料理抽出作業終了後画像
fooddetectionライブラリでできること
長所: ・大量のデータを学習させずとも料理の部分を検知することが可能 ・検知した部分以外の部分(背景など)を削除し、透明化することが可能短所:
・AIではないので精度が悪い
・自動化できていない部分がある
料理部分だけ抽出したい場合のみ使えるライブラリとなっている。
AIを用いているわけではないので精度が悪かったり、手動でやらねばならない作業もあるが
ライブラリをインストールするだけで簡単に料理抽出が行えるので是非使ってみて欲しい。
ライブラリの使用方法
###前提 言語:Python3.7、Python3.8、Python3.9$ pip install fooddetection
ライブラリをPython環境にインストール
https://pypi.org/project/fooddetection/
###手順①~必要なライブラリのインストール~
from fooddetect import *
# from fooddetect import show_contours,detect_food でもOK
show_contours('./images/中華.jpg')#引数には画像パスを入れる
緑の楕円が料理の輪郭でこのライブラリでは緑の楕円を複数表示するよう設定している。
ユーザーは出力画像から適切な緑の楕円を選択する必要がある。
この選択でどこの部分を抽出するか決定するのでとても大事な作業になる。
####選択の仕方
①料理の部分と同じくらいの面積・形をしている楕円を見つける。
②①で見つけた楕円の面積、大きさが画像全体の楕円の中で大きい方から数えて何番目か考える。
→題材としている中華画像なら皿の縁である楕円が料理と同じサイズであり、その面積は大きい方から数えて二番目に大きいことがわかる。
以降、「手順②で選択した楕円の番号」という言葉が出てくるが、それは選択した楕円の面積が大きい方から数えて何番目になるのかと考えてもらいたい。
Ex>題材としている中華の画像であれば
「手順②で選択した楕円の番号」 = 2 になる。
輪郭となる楕円を選択できたら次の手順③に進む!!!
###手順③~背景透明化~
手順③ではdetect_food関数を利用する。
detect_food('./images/中華.jpg',2)#引数には画像パス、手順②で選択した楕円の番号を入れる
一見、完成したと見えるかも知れないがよくみると皿の縁の楕円のところで抽出してくれていない、、、
この出力結果と手順②の出力結果と比較すると出力画像は番号1(一番大きい楕円)で切り抜いてしまっていることがわかる。
プログラミング上と目視で選択するものでは誤差が生じる時があるらしい、、、
####解決案・微調整
基本は手順②で目視で選択した番号でうまいこといくのだが、今回のように予期していない楕円で抽出されてしまうことがある。
その場合は、
手順②で選択した楕円の番号 ±1を引数に再度入れ直して微調整すると精度が向上するだろう
detect_food('./images/中華.jpg',3)
出力画像は以下のようになる。
しっかりと皿の縁のところで切り取ってくれたので成功と言えるだろう。
もちろん抽出した画像も保存されている。
試しに他の画像でも実験
###① 題材画像:焼きそばfrom fooddetect import *
show_contours('./images/焼きそば.jpg')#引数には画像パスを入れる
今回は1番大きい緑の楕円が良さそうなので引数には1を代入
detect_food('./images/焼きそば.jpg',1)#引数には画像パス、手順②で選択した楕円の番号を入れる
??????思ってたのと違う、、、
プログラミング上では右上の部分が一番大きいらしい。
手順②で選択した楕円の番号 ±1
右の上の緑の楕円の次に大きい場所と考えて2を引数に代入し再度実行
detect_food('./images/焼きそば.jpg',2)