0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

【学習用】Google Cloudで体感する最小データ基盤構築(検討メモ)

Posted at

【学習用】Google Cloudで体感する最小データ基盤構築(検討メモ)

TL;DR
ソースは Cloud Storage(別環境のFS相当)BigQuery(別環境のRDBスナップショット相当)
DataflowテンプレートでCSV→Parquetをデータレイク化(GCS/BigLake)DataformでDWH整備(ELT/ETL)
セキュリティは DLP/動的マスキング/RLS/CMEK/VPC SC を段階導入。AIは Gemini in BigQueryBQ ML/Vector Search を「触って理解」。


1. ねらい(デモようなので、体感ポイントを押さえたい)

  • データレイク体験:GCSに置いたCSVを Dataflow File Format Conversion テンプレートで Parquet 化→BigLake外部テーブルでスキーマ化して“レイクの扉”を開く。
  • DWH体験:別環境RDB相当=BigQueryの既存スナップショットを“ソース扱い”にし、レイクのParquet(BigLake)とDataformで結合・整形・集約(ETL/ELT)。
  • セキュリティ体験DLP(データプロファイル/マスキング/トークナイズ)BigQueryの動的データマスキング/列レベル制御/行レベルセキュリティCMEK(GCS/BQ)VPC Service Controls
  • AI体験Gemini in BigQueryで自然言語→SQL/説明、BQ MLで簡単なモデル、Vector Searchで類似検索。

2. アーキテクチャ


3. データセット(パブリックデータセットの中から検討)

  • NYC Taxi Trips(BigQuery Public Datasets / TLC公開元あり):時系列・地理・金額など“基礎の塊”。GC公式ブログにも活用例。(BigQuery の一般公開データセット | Google Cloud)
  • TheLook E-Commerce(Lookerチーム提供の合成データ):顧客・注文・商品・Webイベント等、DWHの基本関係を一通り実感。Marketplaceから追加可。(theLook eCommerce)

どちらも BQ Public Datasets から試すことが可能(サンドボックス/Free Tier など)。(BigQuery public datasets | Google Cloud)


4. 公式ドキュメント(抜粋)


5. まとめ

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?