Help us understand the problem. What is going on with this article?

Python3 + Goole App Engineスタンダード環境でCloud Storageに保存した学習済みモデルをロードする

これはなに?

  • 学習済みモデルをCloud Storageに保存してGAEで使おうと思った
  • スタンダード環境だとローカルにファイル保存できない
  • ファイルをopenで読み込めるのはPython2までしかサポートしてなかった
  • バイトストリームからロードすることで解決

準備

  • 以前の記事で環境は準備済み
  • Cloud Storageのバケットは用意しておく
  • 事前に学習済みモデルをバケットに保存しておく
# 学習
model = RandomForestRegressor()
model.fit(X_train, y_train)
file_name = 'model.pkl'

# ファイルへ保存
with open(file_name, 'wb') as f:
  pickle.dump(model, f)

# Cloud Storageへアップロード
bucket = storage.Client().get_bucket('temp')
blob = bucket.blob(file_name)
blob.upload_from_filename(filename=file_name)

ソースコード

  • Python3に対応したpackagegoogle-cloud-storageをインストールするようにrequirements.txtに追加する
requirements.txt
google-cloud-storage
responder
gunicorn
sklearn
uvicorn
  • 重要部分のみ
main.py
from google.cloud import storage
import pickle

client = storage.Client()
bucket = client.get_bucket('temp')
blob = bucket.get_blob('model.pkl')
model = pickle.load(blob.download_as_string()) # バイトストリームからロード。このメソッドだとローカルにファイルを生成しない
y_pred = model.predict(df) # df: 予測対象のデータフレーム

考察

  • 実運用される機械学習アプリケーションでは、学習と予測は通常分かれる。
  • 学習はバッチ等で実行してストレージ等に保存し、予測はAPIとして提供しオンラインで実行する場合が多い。
  • APIサーバーとしてGAEは1つのソリューションだが、制約が多いのでちょっと使いづらいと思うようになってきた :thinking:
Why not register and get more from Qiita?
  1. We will deliver articles that match you
    By following users and tags, you can catch up information on technical fields that you are interested in as a whole
  2. you can read useful information later efficiently
    By "stocking" the articles you like, you can search right away
Comments
Sign up for free and join this conversation.
If you already have a Qiita account
Why do not you register as a user and use Qiita more conveniently?
You need to log in to use this function. Qiita can be used more conveniently after logging in.
You seem to be reading articles frequently this month. Qiita can be used more conveniently after logging in.
  1. We will deliver articles that match you
    By following users and tags, you can catch up information on technical fields that you are interested in as a whole
  2. you can read useful information later efficiently
    By "stocking" the articles you like, you can search right away