このコンテンツは「後半」です。「前半」は以下を参照してください。
http://qiita.com/nagahisa/items/d491da7099c1229d42d2
AGENDA
(0.はじめに)
(1.GCP利用開始)
(2.CGEとは?)
(3.GCE使ってみる)
4.GAEとは?
5.GAE使ってみる
6.Cloud Datastoreとは?
7.Cloud Datastoreってみる
8.Cloud Storageとは?
9.Cloud Storage使ってみる
#4.GAEとは?
前半のGCEは"IaaS"なので、PCのインストールやったことのある人であれば概念は比較的理解しやすく簡単だったと思いますが、GAEは"PaaS"なので、ちょっと事前説明が必要です。
最近は"PaaS"という言葉はあまり流行ってませんが、まずはPaaSって何の為のものか?から見ていきましょう。
(1)PaaSとは?
「クラウドコンピューティング」を大きく分けるとIaaS,PaaS,SaaSと大きく3つに分けられます。
連載の最初で私はIaaSは「サーバ」や「回線」などのインフラを仮想的に提供するサービス,SaaSはソフトウェアを提供するサービス,PaaSは「開発環境」を提供するものと説明しました。
しかし,「開発環境を提供する」と一口に言っても人によっては色々な意味合いが出てきます。
単に「開発環境を提供する」という事であれば,別にIaaSでもOSのインストールなどを行えば開発環境ができますし,
1枚のWebページを公開するだけであればSaaS的なサービスでもWebサイトやブログを構築できるサービスはあります。
それではPaaSは,どのような「開発環境」を提供するものになるのでしょうか?
PaaSによって,提供形態に違いはありますが,PaaSは一般的にはプログラムの実行環境を提供するものと言われています。
・PaaS=「プログラムの実行環境を提供するもの」
なので
・「PaaSを使えば、(VMとかOSとかミドルとか用意しなくても)プログラムが実行できる」
ってことです。とっても便利そうですよねー。
ここの説明の図がわかりやすいかも。
https://www.cloud-ace.jp/report/detail01/
そもそもGCPは、2009年2月に正式サービス開始されたGAEから始まりました。そのころ Googleは「これからはPaaS!」といってGAEを提供し、GCEのようなIaaSは提供して来ませんでした。
https://ja.wikipedia.org/wiki/Google_App_Engine
でも、そのころのPublic PaaSはherokuなどが一部の開発者の間で盛り上がったものの、結局流行らなかったんです。同時期にVMwareからCloud Foundry(CF)というPaaS基盤ソフトも出て来たのですが同様でした。「PaaS制約」のためPaaS自体が流行らなかった、と言えると思います。
Public PaaSはプロバイダがプログラム実行環境を提供する=ユーザ側がプログラム実行環境を変更できません。Public PaaSプロバイダが用意した、開発言語や Http Serverや DBなどのサービスを使うしかないわけです。最初のGAEやCFは用意されているサービスが少ない、つまり、開発者にとっては「開発言語やミドルの選択肢が少ない・使いたいミドルが入れられない」という制約になってしまったのです。
http://blog.cloud66.com/its-official-public-paas-is-dead/
でも最近はPaaSのコンセプト「プログラムの実行環境を提供する」が見直されてきています。
CFもIBM PaaSのBluemixだけでなく、SAP HANA/GE Predixの開発基盤などにも使われ始めてきています。
http://cf-api-version.mybluemix.net/
個人的には、今流行りのServerless Computingも一種のPaaSと言ってもいいのではと思っています。
https://en.wikipedia.org/wiki/Serverless_computing
(2)Git,GitHubとは?
ハンズオンで使うので説明が必要なんですが、、、、
・Git = みんなで使えるバージョン管理ツール
・GitHub = みんなでGit編集できる場所
ってな感じでゴマカスので()、ググって調べててみてください。
ハンズオンでは、PaaS上で動かすプログラムのソースコードを取ってくる時に使います。
(3)memcacheとは?
これもハンズオンで使うので説明が必要なんですが、、、、
・DBやファイル(永続記憶)ではなく、メモリ上のキャッシュ(揮発記憶)
ってな感じでゴマカスので()、ググって調べててみてください。
ざっくり言うと、Keyとその値(Key-Value)という形式で値を入出力できる揮発性の外部記憶です。
ハンズオンでは、PaaS上で動かすプログラムの最初のバージョンでユーザが入力した文字列を保持するところにに使います。
(4)やっとGAEとは?
はい、GCPのPaaSです
https://cloud.google.com/appengine/
GAEには、standard environment(SE) と flexible environment (FE)があります。
flexible environment使うと「PaaS制約」を飛び越えたりできるようですが、今回はstandard environmentを触るだけです。
https://cloud.google.com/appengine/docs
#5.GAE使ってみる
このハンズオンでは、Pythonで書かれたWebアプリケーションを、以下の3つのパターンで順番に動かしていきます。
- memcache版: 入力データ保持にmemcacheを使うWebアプリケーションです。
- Datastore版: 入力データ保持にDatastoreを使う同じWebアプリケーションです。
- Cloud Storage版: 入力データをCloud Storageにも保存するようにした同じWebアプリケーションです。
GAEはPaaSですので、基本的には
- Webアプリケーションのプログラム(ソースコード)を用意する
- GAEにデプロイする
だけで、Webアプリケーションを動かすことができます。
では早速、memcache版のプログラムを用意して、GAEにデプロイしてみましょう。
##(0)Cloud Shell起動
プログラムを自分のPCに用意して、自分のPCからGAEにデプロイすることも出来ますが、準備が面倒なので、"Cloud Shell"を作業場所に使います("Cloud Shell"とっても便利)
##(1)memcache版のプログラムを用意
今回のプログラムは実はGoogleがトレーニング用に用意してくれています。
・GCP TrainingのGitHubレポジトリ
https://github.com/GoogleCloudPlatformTraining
・今回使うmemcache版
https://github.com/GoogleCloudPlatformTraining/cp100-appengine-memcache-python
・"Cloud Shell"上で以下のコマンドを入力してmemcache版のプログラムを入手(git clone)します。
git clone https://github.com/GoogleCloudPlatformTraining/cp100-appengine-memcache-python.git
##(2)memcache版プログラムをデプロイ
・デプロイは、git cloneされたディレクトリにある appcfg.py コマンド実行で行います。
cd cp100-appengine-memcache-python
appcfg.py -A $DEVSHELL_PROJECT_ID update .
・色々表示されますが、最後に"Completed update of app:..."って表示されるとデプロイ成功です。
・ここで "Completed update of app:cp100-xxxxx (上記キャプチャでは cp100-148305")って表示されていますが、これがアプリケーション名(Project_ID)です。
アプリケーション名はGAEの世界の中でユニークに設定する必要がありますが、なんと"Cloud Shell"は、自動的にユニークな名前を割り振って、$DEVSHELL_PROJECT_ID という環境変数に入れてくれてます。
(appcfg.py コマンドの "-A" 引数に指定するのがアプリ名です)
##(3)memcache版アプリの動作確認
このアプリ(Webアプリ)のURLは、http://<アプリ名>.appspot.comとなります。
ブラウザからこのURLにアクセスしてみましょう。
はい、簡単なGuestbookの完成です。適当に"New Entry"に入力して"Submit"してみてください。
##(4)memcacheの確認
では、このアプリのmemcacheを少しみてみましょう。
このアプリのプログラムでは、memcacheのキーを"entries"としているので、それを入力して検索してみます。
#6.Cloud Datastoreとは?
Cloud Datastoreは GCPの非リレーショナルデータ用のNoSQLデータベースです。
NoSQLデータベースは、基本的に KeyValue型テータストアの機能を持っています。
https://cloud.google.com/datastore/
#7.Cloud Datastoreってみる
##(1)Datastore版のプログラムを用意
・"Cloud Shell"のホームディレクトリに戻って、以下のコマンドを入力してDatastore版のプログラムを入手(git clone)します。
git clone https://github.com/GoogleCloudPlatformTraining/cp100-appengine-datastore-python.git
##(2)Datastore版プログラムをデプロイ
・デプロイは、git cloneされたディレクトリにある appcfg.py コマンド実行で行います。
cd cp100-appengine-datastore-python
appcfg.py -A $DEVSHELL_PROJECT_ID update .
##(3)Datastore版アプリの動作確認
・同じアプリ名(Project_ID)でupdateデプロイを行っているので、Webアプリは同じURLで動いています。
#8.Cloud Storageとは?
Cloud StorageはAWSのS3と同様の分散オブジェクトストレージです。
#9.Cloud Storage使ってみる
##(1)Datastore版のプログラムを用意
・"Cloud Shell"のホームディレクトリに戻って、以下のコマンドを入力してCloud Storage版のプログラムを入手(git clone)します。
git clone https://github.com/GoogleCloudPlatformTraining/cp100-appengine-cloudstorage-python.git
##(2)Cloud Storage版プログラムで使うCloud Storage環境を用意
データを保存するCloud Storageのバケットを作って、それをプログラム内に指定します。
バケット名は全世界でユニークにする必要があるので、自分の名前を付加するなど工夫してください。
・PJデフォルトを使っても良いが、ここでは新規にバケット作成(例:cp100-kenzo)
##(3)Cloud Storage版プログラムを修正
上で作ったCloud Storageのバケット名(例:cp100-kenzo)をプログラムで指定します。
対象のソースコードは guestbook.pyです。
viなどのエディタで開いて以下を編集します。
BUCKET_NAME = 'ここに自分のバケット名を書く'
##(4)Cloud Storage版プログラムをデプロイ
・デプロイは、git cloneされたディレクトリにある appcfg.py コマンド実行で行います。
appcfg.py -A $DEVSHELL_PROJECT_ID update .
##(5)Cloud Storage版アプリの動作確認
・同じアプリ名(Project_ID)でupdateデプロイを行っているので、Webアプリは同じURLで動いています。
##(6)Cloud Storageの確認
Cloud Storage画面からバケットの中身を確認してみましょう。
・新しいオブジェクトが作成されています
Enjoy!