自己紹介
AppsFlyerというモバイル広告計測ツールの会社のソリューションアーキテクトです。前職ではIBMでデータエンジニアをやっており、DWHの構築などをネットワークやOSレベルのインフラレベルのこともやっていましたが、基本的にはオンプレだけでしたので、Google CloudやAWSのことをキャチアップしたいと考えているところです。
AppsFlyerは計測ツールですので、そのローデータをお客様側に持ち出していただいて保管・分析いただくことは通常のユースケースになります。その連携方式の一つがPush APIという機能で、AppsFlyerから発生したイベントをリアルタイムで指定のエンドポイントにデータを送信できるというものなのです。
ただ、対面のお客様はエンジニアではなくマーケターの方だったりしますので「エンドポイントってそもそも何?」というような質問を多々受けることもあります。
「Google CloudやAWSならきっと簡単に作れるんだろうなあ」と思いつつ、自分ではまだ作ったことはなかったので、今回Push APIからの情報をGoogle Cloud側で受け取り、格納する処理を調べながら試しに実装してみることにしました。
Push APIのエンドポイントの仕様
Push APIのサーバー要件を確認すると、成功時にステータスコード200を返すことのできるGoogle Cloud外からアクセス可能なエンドポイントが準備できれば良さそうです。
※本番で使うのなら、IPアドレスのホワイトリスト化や、余分なポートを閉じておくようなセキュリティ上の配慮も必要そうですが、今回はこの部分は端折ることにします。
Cloud Functionsでエンドポイントを作る
調べてみたところ、Cloud FunctionsがHTTPリクエストを受け取って簡単に処理できそうなので、これで実装します。
手始めに、認証なしのHTTPSトリガーのCloud Functionsを作成します。
このNode.jsのコードを書き換えて、ステータスコード200とRequest body内のJSONをテキスト化して返すようにしました。
const functions = require('@google-cloud/functions-framework');
functions.http('helloHttp', (req, res) => {
res.writeHead(200, {
"Content-Type": "text/html"
});
const responseMessage = JSON.stringify(req.body);
res.end(responseMessage);
console.log(responseMessage);
});
これをデプロイすると数分後に、Cloud Functionsが立ち上がり、エンドポイントとのURLも確認できます。
試しにcurlコマンドを叩いてみると、
curl -X POST https://function-1-qabhtikgmq-an.a.run.app -H "Content-Type: application/json" -d '{"Id": 123456, "name": "Makoto"}'
問題なくRequest BodyのJSONがそのまま返ってきました。
{"Id":123456,"name":"Makoto"}
Cloud Functionsの画面上のログの方からも確認できます。
AppsFlyerからテスト送信してみる
AppsFlyerの管理画面「APIアクセス」からPush APIのエンドポイントを設定し、POSTでテスト送信してみると、「テストが正常の送信されました」とのメッセージ。
Cloud Functionsのログ見ると、データがRequest BodyのJSONとして確かに受け取れていそうです。
ちなみにGETでのテスト送信も試したところ、データはURLのパラメータとして送られてきました。
ここまでで、Cloud FunctionsにてHTTPリクエストを受け取るためのエンドポイントを作り、実際にテスト送信でデータを受け取れることを確認しました。
Cloud Functionsで受け取ったデータをFirestoreに保存する
せっかくJSON形式でデータを受け取っているので、そのまま格納したいので、適当なNoSQLデータベースサービスがないかを探したところ、Cloud Firestoreが良さそうだとわかりました。
Cloud Firestore には、異なるユースケース向けに最適化された 2 つのモード(Datastore モードとネイティブモード)がありますが、今回はネイティブモードを選択しました。
Cloud Functionsから利用するには、@google-cloud/firestore のパッケージを利用するようですので、package.jsonにこの依存関係を追加します。
{
"dependencies": {
"@google-cloud/functions-framework": "^3.0.0",
"@google-cloud/firestore": "^6.0.0"
}
}
また、同じプロジェクト内でCloud Firestore を有効化していれば、あまり細かい接続情報などを意識せずに、Firestoreとの接続ができるようです。
あとは任意のコレクションIDとドキュメント名を指定し、JSONデータを入れていけば良さそう。
今回は受け取ったRequest bodyをそのまま新規のドキュメントとして作っていきたいので、ドキュメントのIDを自動付与するfirestore.collection('af_push_api_data').add(req.body);
でデータを格納することにしました。
const functions = require('@google-cloud/functions-framework');
const {Firestore} = require('@google-cloud/firestore');
// Create a new client
const firestore = new Firestore();
functions.http('helloHttp', (req, res) => {
// Add a new document with a generated ID
firestore.collection('af_push_api_data').add(req.body);
res.sendStatus(200);
});
上記のコードをデプロイし、AppsFlyer側からテスト送信したところ、Firestoreに無事にドキュメントが作られて、フィールドも入ってます。
クエリビルダーで簡単にデータもみれますね。
Push APIでのデータ送信はリアルタイムに各種のイベントもどんどん連携されてくるので、面白いです。
まとめ
一部コーディングのデバッグなどでは苦労しましたが、環境構築はほとんど不要で、簡単にできてしまうのがクラウドのすごいところだと実感しました。Google Cloudはもっと触って理解していきたいです。
本番利用では、さらにCloud Load Balancingなどで受けるようにして、セキュリティ面での対応も入れると良さそうですね。