More than 5 years have passed since last update.

環境構築からk平均法を用いた画像分類までをやってみた話

Last updated at 2018-11-21Posted at 2018-11-21

こちらは株式会社BIOTOPEの社内イベント、第二回BIOTOPE HACKATHON のための資料です。
その資料を一般公開します。

もし改善点等ありましたらどなたでもご指摘いただけると幸いです。

環境構築編

こちらはまだpython環境に全く触れたことない人向きです。
(対象はmacユーザの方です、Windowsはごめんなさい分からないです…)
私は普段pyenv_vertualenvを使っているので、そのinstallもサクッと載せておきます。

Homebrewをinstall

ターミナルを起動し、以下コマンドをコピペします。

//raw.githubusercontent.com/Homebrew/install/master/install)"

pyenv_virtualenvをinstall

詳しくは参考文献の部分を見てください
仮想環境バージョン管理まとめ Python

環境を作成

作業ディレクトリに移動して、pyenv_virtualenvを用いて仮想環境を構築します。
私はanaconda3-5.0.1で作りましたが、たぶんpythonでも大丈夫です。
しかし、pythonで作成する場合は、python3を使用してください。
仮想環境名は自分の好きな名前でどうぞ。

pyenv virtualenv 3.6.4 仮想環境名

そして、作業ディレクトリで作成した仮想環境に設定します。

scikit_imageをinstall

最後に仮想環境を設定した状態で以下のコマンドを叩き、scikit_learnとscikit_imageを入れます。

``````pip install scikit-image

これで環境構築は完了です。

K平均法とは

今回、画像分類をするためにK平均法という手法を用います。
K平均法はこちらのページに非常にわかりやすく書かれています。

K平均法とはK-means法とも呼ばれており、

クラスラベルがトレーニングデータに含まれていない教師なし学習の一つで
答えが事前にわかっていないデータから隠れた構造を見つけ出すことができる(=クラスタ分析)

…というものです。
クラスタリングの目標は、
データを自然なグループにまとめる方法を見つけ出すことにあります。

というわけで今回はこのアルゴリズムを用いて
コーディングを行い画像分類を行ってみたいと思います。

コーディング編

以下参考コードとなります。
コードはかなり、参考文献の方のコードを参考にさせていただきました。

変数名とクラスター数の数を変えることで使うことができます。

ディレクトリ名

origin_path：画像を入れるディレクトリ名 (/〇〇/の形で記載)
convert_path：元々の画像を同じサイズに変形させた時の画像を入れるディレクトリ名 (/〇〇/の形で記載)
group_path：グループ分けした時のディレクトリ名 (/〇〇/の形で記載)

画像サイズ

h：リサイズした時の画像サイズの縦(int型)
w：リサイズした時の画像サイズの横(int型)

(注)
データの画像サイズを統一しないとプログラムエラーが発生します。
今回のサンプルプログラムでは適当にh=100, w=125としましたが、
リサイズすることによって画像の比率が変わってしまうことがあるので注意が必要です。

クラスタ数

n_cluster：何分類したいかの数(int型)

pythonコード

こちらは、origin_path内に入っている画像を任意の数でグループ分けし、
グループごとgroup_path内のディレクトリ内に画像をコピーするというものです。

img_kmeans.py

# coding: utf-8
import os
import shutil
import numpy as np
from PIL import Image
from skimage import data
from sklearn.cluster import KMeans


if __name__ ==  "__main__":

    # 変数名
    origin_path = './img/'
    convert_path = './img_convert/'
    group_path =  './img_group/'

    # 画像サイズ
    h = 100
    w = 125

    # クラスタ数
    n_cluster = 2



    # 画像サイズを揃えて保存
    for f in os.listdir(origin_path):
        print(f)
        img = Image.open(origin_path+f)
        img=img.convert('RGB')
        img_resize = img.resize((w,h))

        # もしディレクトリがなければ、そのディレクトリを作成
        if os.path.exists(convert_path) == False:
            os.mkdir(convert_path)

        img_resize.save(convert_path+f)

    # 3次元の画像データを2次元データに変換する
    feature = np.array([data.imread(convert_path + f)for f in os.listdir(convert_path)])
    feature = feature.reshape(len(feature), -1).astype(np.float64)

    # 学習
    model = KMeans(n_clusters=n_cluster).fit(feature)

    # ラベリングの結果
    labels = model.labels_
    print(labels)

    # 分類結果ごと、画像をディレクトリにコピー
    for label, path in zip(labels, os.listdir(convert_path)):

        if os.path.exists(group_path) == False:
            os.mkdir(group_path)

        copy_path = group_path+str(label)

        if os.path.exists(copy_path) == False:
            os.mkdir(copy_path)

        shutil.copyfile(origin_path+path, copy_path+"/"+path)
        print(label, path)