Kerasで始める深層学習

Posted at 2024-08-13

はじめに

こんにちは！今回は、Pythonの人気深層学習ライブラリであるKerasについて、初心者の方にも分かりやすく解説していきます。Kerasの基本から応用まで、実践的なコード例を交えながら学んでいきましょう。

1. Kerasとは？深層学習の味方

Kerasは、Pythonで書かれた使いやすい深層学習ライブラリです。直感的なAPIを提供し、初心者でも簡単に複雑なニューラルネットワークを構築できます。TensorFlowやTheanoなどのバックエンドを利用しているので、高速で効率的な計算が可能です。

以下は、Kerasをインポートする簡単な例です：

from keras import models
from keras import layers

model = models.Sequential()
model.add(layers.Dense(32, activation='relu', input_shape=(784,)))
model.add(layers.Dense(10, activation='softmax'))

2. Kerasのインストール方法

Kerasをインストールするのは簡単です。pipを使って一行でインストールできます。まずは、仮想環境を作成することをおすすめします。

pip install keras

インストールが完了したら、以下のコードでKerasが正しくインポートできるか確認しましょう：

import keras
print(keras.__version__)

3. Sequentialモデル：層を積み重ねる

Kerasの最も基本的なモデル構造は、Sequentialモデルです。層を順番に積み重ねていくだけで、複雑なニューラルネットワークを構築できます。

from keras.models import Sequential
from keras.layers import Dense

model = Sequential([
    Dense(32, activation='relu', input_shape=(784,)),
    Dense(64, activation='relu'),
    Dense(10, activation='softmax')
])

4. モデルのコンパイル：学習の準備

モデルを構築したら、次はコンパイルします。ここで最適化アルゴリズム、損失関数、評価指標を指定します。

model.compile(optimizer='adam',
              loss='categorical_crossentropy',
              metrics=['accuracy'])

5. モデルの学習：fitメソッドを使って

モデルの学習は、fitメソッドを使って行います。エポック数やバッチサイズを指定して、学習を開始しましょう。

history = model.fit(x_train, y_train,
                    epochs=10,
                    batch_size=128,
                    validation_split=0.2)

6. モデルの評価：テストデータで性能を確認

学習したモデルの性能を評価するには、evaluateメソッドを使います。

test_loss, test_acc = model.evaluate(x_test, y_test)
print(f'テストデータでの精度: {test_acc}')

7. 予測：新しいデータに対する予測

学習したモデルを使って、新しいデータに対する予測を行うことができます。

predictions = model.predict(x_new)

8. モデルの保存と読み込み

学習したモデルは保存して、後で再利用することができます。

# モデルの保存
model.save('my_model.h5')

# モデルの読み込み
from keras.models import load_model
loaded_model = load_model('my_model.h5')

9. データの前処理：画像データの扱い方

画像データを扱う際は、前処理が重要です。Kerasには便利な前処理ツールが用意されています。

from keras.preprocessing.image import ImageDataGenerator

datagen = ImageDataGenerator(
    rotation_range=40,
    width_shift_range=0.2,
    height_shift_range=0.2,
    shear_range=0.2,
    zoom_range=0.2,
    horizontal_flip=True,
    fill_mode='nearest')

10. 転移学習：事前学習済みモデルの活用

Kerasには、ImageNetで事前学習済みの強力なモデルが用意されています。これらを使って転移学習を行うことで、少ないデータでも高精度なモデルを作ることができます。

from keras.applications import VGG16

base_model = VGG16(weights='imagenet', include_top=False)

11. カスタムレイヤーの作成

Kerasでは、独自のカスタムレイヤーを作成することもできます。これにより、より柔軟なモデル設計が可能になります。

from keras import backend as K
from keras.layers import Layer

class MyCustomLayer(Layer):
    def __init__(self, output_dim, **kwargs):
        self.output_dim = output_dim
        super(MyCustomLayer, self).__init__(**kwargs)

    def build(self, input_shape):
        self.kernel = self.add_weight(name='kernel', 
                                      shape=(input_shape[1], self.output_dim),
                                      initializer='uniform',
                                      trainable=True)

    def call(self, x):
        return K.dot(x, self.kernel)

    def compute_output_shape(self, input_shape):
        return (input_shape[0], self.output_dim)

12. コールバック：学習プロセスのカスタマイズ

コールバックを使うと、学習プロセスをより細かくコントロールできます。例えば、一定のエポックごとにモデルを保存したり、学習率を動的に調整したりできます。

from keras.callbacks import ModelCheckpoint, ReduceLROnPlateau

checkpoint = ModelCheckpoint('best_model.h5', save_best_only=True)
reduce_lr = ReduceLROnPlateau(monitor='val_loss', factor=0.2, patience=5)

model.fit(x_train, y_train, epochs=50, callbacks=[checkpoint, reduce_lr])

13. マルチGPU学習：計算を高速化

複数のGPUを使って学習を高速化することもできます。Kerasは簡単な設定で、マルチGPU学習をサポートしています。

from keras.utils import multi_gpu_model

# GPUが2つある場合
model = multi_gpu_model(model, gpus=2)

14. 時系列データの処理：RNNとLSTM

Kerasは、RNNやLSTMなどの再帰型ニューラルネットワークもサポートしています。時系列データの処理に適しています。

from keras.layers import LSTM

model = Sequential()
model.add(LSTM(32, input_shape=(timesteps, data_dim)))
model.add(Dense(10, activation='softmax'))

15. Functional API：より複雑なモデル構造

Sequentialモデルよりも複雑なモデル構造が必要な場合は、Functional APIを使用します。これにより、多入力多出力モデルや共有レイヤーを持つモデルなどを作成できます。

from keras.layers import Input, Dense
from keras.models import Model

inputs = Input(shape=(784,))
x = Dense(64, activation='relu')(inputs)
x = Dense(64, activation='relu')(x)
predictions = Dense(10, activation='softmax')(x)

model = Model(inputs=inputs, outputs=predictions)

16. モデルの可視化：構造を理解する

Kerasには、モデルの構造を可視化する機能があります。これにより、複雑なモデルの全体像を把握しやすくなります。

from keras.utils import plot_model

plot_model(model, to_file='model.png', show_shapes=True)

17. カスタム損失関数：特定のタスクに適した損失を定義

特定のタスクに適した損失関数が必要な場合、カスタム損失関数を定義できます。

def custom_loss(y_true, y_pred):
    return K.mean(K.square(y_pred - y_true), axis=-1)

model.compile(optimizer='adam', loss=custom_loss)

18. データ拡張：学習データを増やす

データ拡張を使うと、既存のデータセットを基に新しいサンプルを生成し、モデルの汎化性能を向上させることができます。

from keras.preprocessing.image import ImageDataGenerator

datagen = ImageDataGenerator(
    rotation_range=40,
    width_shift_range=0.2,
    height_shift_range=0.2,
    shear_range=0.2,
    zoom_range=0.2,
    horizontal_flip=True,
    fill_mode='nearest')

datagen.fit(x_train)

19. 早期停止：過学習を防ぐ

EarlyStoppingコールバックを使用すると、検証損失が改善しなくなった時点で学習を自動的に停止し、過学習を防ぐことができます。

from keras.callbacks import EarlyStopping

early_stopping = EarlyStopping(monitor='val_loss', patience=10)
model.fit(x_train, y_train, validation_split=0.2, callbacks=[early_stopping])

20. モデルのファインチューニング：事前学習済みモデルの微調整

事前学習済みモデルの一部の層をフリーズし、残りの層を再学習させることで、新しいタスクに適応させることができます。

from keras.applications import VGG16

base_model = VGG16(weights='imagenet', include_top=False)
for layer in base_model.layers[:15]:
    layer.trainable = False

x = base_model.output
x = GlobalAveragePooling2D()(x)
x = Dense(1024, activation='relu')(x)
predictions = Dense(200, activation='softmax')(x)

model = Model(inputs=base_model.input, outputs=predictions)

21. ハイパーパラメータチューニング：最適なモデル設定を見つける

Kerasモデルの性能を最大化するには、適切なハイパーパラメータを選択することが重要です。Kerasと組み合わせて使用できるハイパーパラメータチューニングライブラリ、Hyperasを紹介します。

from hyperopt import fmin, tpe, hp, STATUS_OK, Trials
from keras.datasets import mnist
from keras.utils import to_categorical

def create_model(params):
    model = Sequential()
    model.add(Dense(params['units'], activation='relu', input_shape=(784,)))
    model.add(Dense(10, activation='softmax'))
    model.compile(optimizer=params['optimizer'], loss='categorical_crossentropy', metrics=['accuracy'])
    return model

def objective(params):
    model = create_model(params)
    history = model.fit(x_train, y_train, validation_split=0.2, epochs=10, verbose=0)
    return {'loss': -history.history['val_accuracy'][-1], 'status': STATUS_OK}

space = {
    'units': hp.choice('units', [32, 64, 128, 256]),
    'optimizer': hp.choice('optimizer', ['adam', 'rmsprop', 'sgd'])
}

best = fmin(fn=objective, space=space, algo=tpe.suggest, max_evals=50)
print("Best hyperparameters:", best)

このコードは、ニューラルネットワークの隠れ層のユニット数と最適化アルゴリズムを最適化します。

22. モデルのデバッグ：TensorBoardを使用した可視化

TensorBoardを使用すると、モデルの学習過程を視覚化し、デバッグが容易になります。Kerasは簡単にTensorBoardと統合できます。

from keras.callbacks import TensorBoard

tensorboard = TensorBoard(log_dir='./logs', histogram_freq=1, write_graph=True, write_images=True)
model.fit(x_train, y_train, epochs=50, callbacks=[tensorboard])

学習後、以下のコマンドでTensorBoardを起動できます：

tensorboard --logdir=./logs

23. 正則化テクニック：過学習を防ぐ

Kerasには、過学習を防ぐためのさまざまな正則化テクニックが用意されています。ここでは、Dropout層とL2正則化の使用例を示します。

from keras.layers import Dropout
from keras.regularizers import l2

model = Sequential([
    Dense(64, activation='relu', input_shape=(784,), kernel_regularizer=l2(0.01)),
    Dropout(0.5),
    Dense(64, activation='relu', kernel_regularizer=l2(0.01)),
    Dropout(0.5),
    Dense(10, activation='softmax')
])

24. カスタムメトリクス：モデルの評価をカスタマイズ

Kerasでは、独自の評価メトリクスを定義することができます。以下は、F1スコアを計算するカスタムメトリクスの例です。

from keras import backend as K

def f1_score(y_true, y_pred):
    true_positives = K.sum(K.round(K.clip(y_true * y_pred, 0, 1)))
    possible_positives = K.sum(K.round(K.clip(y_true, 0, 1)))
    predicted_positives = K.sum(K.round(K.clip(y_pred, 0, 1)))
    precision = true_positives / (predicted_positives + K.epsilon())
    recall = true_positives / (possible_positives + K.epsilon())
    f1_val = 2*(precision*recall)/(precision+recall+K.epsilon())
    return f1_val

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up