##はじめに
先日GCPのプロフェッショナル資格に合格し記事も書きましたのでこれからGCPを触る方、概要だけ知りたい初心者の方向けにGCPの主要サービスまとめと他のクラウドサービスとの比較を作成しました。
GCPには非常に多くのサービスがありますがこちらを見ていただければ基本的なサービス、および売りにしているサービスを理解できなぜGCPを選ぶのか、選ばれないのかを把握できるようにしています。
なおクラウドサービスそのものの解説については「クラウドサービスとは ~若手クラウドエンジニアが語るクラウド基礎の基礎~」にまとめておりますのでこちらも併せてご覧ください!
##Google Cloud Platform(GCP)とは
GCPとはGoogleが提供するクラウドサービス群の総称でありAmazonのAmazon Web Service、MicrosoftのAzureと並んで世界の三大クラウドサービスの1つです。
GCP最大の顧客はGoogleでありGmail、Google Earth、Youtubeなどの代表的なサービスはすべてGCP上で稼働し、さらにサービスを運用する中で得た知見をクラウドサービスの改善に役立てています。
####GCPターニングポイント
GCPはAWSよりも後発でしたがいくつかのターニングポイントを経て日本でもシェアを伸ばしつつあり、中でも機械学習、ビッグデータ解析のサービスは最大の長所となっています。
-
Google App Engine サービス開始
のちのGCPのメインサービスとなるGAEがサービス開始。当時はAWSがやっと認知され始めた時期でGAEも知名度は低かった。加えてPaaSサービスだったため制約が多く導入のハードルが高かったといわれている。 -
GCP サービス開始
既存のクラウドサービスを統合する形でGCPがサービスを開始。 -
Tensorflow登場
Google独自の機械学習ライブラリが発表され人工知能分野の注目が一層高まった。TensorflowはGoogleが学習させた機械学習モデルを無料で公開するサービスで囲碁AIのAlphaGoや自動翻訳モデルの構築に導入された。 -
東京リージョンリリース
クラウドサービスはリージョンと呼ばれるデータセンター群によって可用性、冗長構成が保たれており2016年に東京リージョンが開始したことで日本の大規模システムでも高速通信、冗長化が可能となった。これにより多くの日系企業でクラウドサービスが普及していくこととなる。
###2. 基礎的なサービス
名称 | 概要 | 利用ケース・特徴 |
---|---|---|
Google Compute Engine | コンピューティングサービス IaaS |
・OS、メモリ、CPUなどの性能を指定して仮想マシン(VM)を起動し利用できる ・汎用性が極めて高く他のDBやストレージサービスもその気になればGCEのみで実装できる ・GCEの方がAWSのEC2よりも費用が安い |
Google App Engine | コンピューティングサービス 環境自動構築 PaaS |
・コンピューティングやDBなど多くのサービスがセットになった環境テンプレートを提供するサービス ・開発者はメインとなるアプリプログラムを実装するだけであとはクラウド側にお任せでデプロイできる ・GAEはGCPのサービスの中でも最も長い歴史がありGCPが強みとしているサービス |
Cloud Functions | サーバレス プログラム自動実行 FaaS |
・関数を作成しイベントベースやスケジュールベースで実行できるサービス ・例えば「バッチが失敗したら実行」「毎週木曜8時に実行」などのケース ・OSやミドルウェアなどはすべてクラウド側で管理されるため開発者はコードや実行設定をするのみ |
Cloud Storage | ストレージサービス | ・非構造化データ(画像やCSVなど)の保存に使われる ・従量課金だがデータ容量に制限はなく非常に高い可用性、耐久性を誇る ・データ分析用のストレージとして使われることが多い(Azure BLOBストレージ) |
Cloud SQL | リレーショナルデータベース | ・MySQLなどのRDBを提供するフルマネージドサービス ・多くのサービスが派生しており工夫して選択することで様々なシーンで採用される ・GCPではOracleを採用できないためAWSと比較して使いにくいといわれている |
##GCPの強みであるサービス
###1. Big Query
クラウドサービスは各社に特徴がありますが、GCPの最大の強みはデータ解析サービスです。Big Dataの並列高速処理サービスであるBig Queryは世界トップクラスの高速処理を低価格で提供しており多くのデータ分析環境で利用されています。その性能はけた違いで「120億行の正規表現検索が5秒で完了する」レベルの検索性能といわれています。このレベルのシステムを自社で構築できる企業はほぼ存在せずGCPを導入する大きなメリットとなっています。
Big Queryまとめ
- 独自の構造を持っておりSQLベースでの高速処理が可能なGCPの目玉サービス
- 性能が上がると金がかかるというビッグデータ解析の常識を覆す圧倒的な安さ
- フルマネージドサービスなのでインフラ側の保守は全く気にしなくて良い
- 他のクラウドサービスやオンプレ環境からの接続もできるので「データ分析部分のみGCP」という使い方も多い
###2. Bigtable
Bigtableは超大容量向けのNoSQLデータベースサービスです。ビッグデータを扱う点ではBig Queryと同じですが、大容量・NoSQL・データベースである(並列分散処理技術ではない)という点で異なるサービスとなっています。こちらもYoutubeやGoogle Mapなど主要サービスのほとんどに使用されており巨大な非構造化データを高速で検索できるという強みがります。
SQLとNoSQLの比較
SQL | NoSQL |
---|---|
・構造化データ(行と列の定義が明確) ・RDBが主流でDBMSによってテーブルを管理 ・厳密な処理が可能なので勘定系DBやユーザーの個人情報などに使われる ・処理は遅い |
・非構造化データ(行と列の定義がない) ・CSVやJSONなど様々な形式でデータを保存 ・大容量で複雑なデータを扱うことが多くSNSの投稿やデータ解析に用いられる ・高速でスケーラブルな処理が可能 |
Bigtableまとめ
- ペタバイトクラスの超大容量向けNoSQLデータベースサービス
- 高い可用性とセキュリティ、処理速度を誇る
- スケーラブルなため容量が増えても処理速度がほとんど落ちない
- NoSQLなので厳密な処理や複雑なSQLクエリ処理は不可能
###3. Spanner
SpannerはマルチRDBと呼ばれる新しい種類のDBサービスです。その最大の特徴はSQL(RDB)とNoSQLの長所を両方備えておりRDBであるにもかかわらず水平スケーリングが可能となっている点です。すなわちSQLによる定義更新、厳密な更新処理、トランザクション管理が可能なうえに数百ノードレベルでの水平分散処理が可能という次世代のサービスとなっています。
みんなの銀行という新銀行が国内で初めて勘定系にパブリッククラウドを採用し、Spannerを導入したことで話題となった
Spannerまとめ
- SQLとNoSQLのいいとこどりDBで、厳密な処理を水平スケーリングで無駄なく行える
- 銀行勘定系システムのようにミスやダウンタイムが許されないケースで最も力を発揮する
- 特殊な制約があり既存のDBの移行は困難(ゼロから作る新サービスには向いている)
- 他のDBと比較して費用が高い(最低でも8万/月)
###4. TensorFlow, Cloud ML Engine
TensorFlowはGoogleが開発した機械学習・深層学習用Pythonライブラリのことです。またこれを用いて作成した機械学習モデルの学習と構築を実現するのがCloud ML Engineです。開発者はTensorFlowを用いることで高度で複雑なモデルを簡単に構築することができ、さらにそれをハイパフォーマンスなGCP上で安全に運用することができるという画期的なサービスとなっています。
TensorFlow, Cloud ML Engineまとめ
- TensorFlowは機械学習モデル構築のための強力なライブラリだが動かすには大容量データと高性能なマシンが必須
- Cloud ML Engineはデータを保存しライブラリを動かすための環境をフルマネージド(GCPに環境管理をすべてお任せ)で提供する
- 分析者は性能を気にせず分析に専念し、使った分だけ料金を払えばよい
- 他にも多くの機械学習用サービスがあり他のクラウドサービスにはない独自性を誇っている
##他サービスとの比較
クラウド | 強み | 弱み |
---|---|---|
GCP | ・Googleのサービスで培った経験が蓄積されている ・ビッグデータ処理サービスが非常に強力 ・管理画面がGUI化されサービスもパッケージ化されているので使いやすい |
・いくつかのサービスでプログラミング言語のサポートが弱い ・Oracleなどのライセンス商品が少ない(既存サービス移行が難しい) ・サービス独自の制約が多い、パッケージ化されていて逆に使いにくい |
AWS | ・シェアNo.1で導入実績が豊富(一番大事!!) ・日本語でも文献が多く言語的な不便さがない ・細かい設定変更やシンプルな動作が売りで一番エンジニア目線である |
・費用面で他のクラウドが有利(他社は後発のため値段を下げてくる) ・BigQueryのような目玉となるサービスがあまりない ・サービスがパッケージ化されていないので割と専門知識が必要 |
Azure | ・OfficeソフトやADなどMSのソフトウェアとの親和性が高い ・オンプレミスサーバとの連携・移行がしやすい ・金融業界や電力業界など特定の業界に強い |
・VMの選択肢が少ない、起動も遅い ・コミュニティが活発ではないのでエラーの調査などで苦戦する ・障害が多い!(経験談) |
マルチクラウド | ・各社のサービスのいいとこどりが可能 ・自社独自のカスタマイズができる ・サービスを越えて冗長化すれば耐障害性が上がる |
・複数のクラウドに精通した高度な社内人材が必要 ・アーキテクチャが複雑化する傾向にある ・障害調査が困難になる |
##最後に
今回はGCPの主要サービスを紹介いたしました。2021年にGCPはAWSと共に日本政府のガバメントクラウドとして認定を受けたので今後ますます注目されるサービスとなっていくでしょう。
これを機にGCP、その他クラウドサービスついて興味を持っていただけると嬉しいです。
コメントや質問などございましたら遠慮なくメッセージをください。
それでは!
##参考文献
GCPの教科書, 吉積 礼敏・他(著), 2019,リックテレコム