0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 1 year has passed since last update.

Bigquery キャッシュについて

Posted at

目次

1.はじめに
2.動作環境
3.BigQueryとは
4.キャッシュについて
5.まとめ

1. はじめに

この記事はBigQueryに関して記実していきます。
仕事でも使用しているGCPのツールで、SQLを使ってデータを加工したりなどしています。

今回は一度処理したクエリを再度処理した時の動作について見ていきたいと思います。

2. 動作環境

・ Mac OS 13.0
・ BigQuery

3. BigQueryとは

BigQuery は、大量のデータを分析するためによく使用されています。
また、SQLを使用してデータセットの検索、集計、グループ化などを行うことができます。

BigQueryの料金はストレージの料金とクエリ料金の合計で決まります。
現在時点(2023年4月11日)での無料枠は
・クエリ料金 : 1ヶ月あたり1TB
・ストレージ料金 : 1ヶ月あたり10GB
となります。
(参照URL)https://cloud.google.com/free/docs/free-cloud-features?hl=ja#free-tier

4. キャッシュについて

今回も使用するデータマートはGoogle側で用意されているデータマートを利用しています。

使用したテーブル
bigquery-public-data.github_repos.commits

テーブルが用意できたら実際にSQLを使って1カラムを抽出するクエリを作成し実行してみます。
そして再度同じクエリを実行して見ます。
2つのジョブ情報についての写真を以下に載せます。
スクリーンショット 2023-04-12 14.54.42.png

結果処理時間は1回目は19秒ほどかかりましたが、2回目は一瞬で処理されました。(処理結果については写真の赤枠参照)
また2回目のジョブ情報の「処理されたバイト数」を見てみると、キャッシュされた結果と表示されています。
というのも1回目のクエリはデフォルトでキャッシュに保存されます。
そして2回目はそのキャッシュからクエリを実行するため高速で動作します。
また、ストレージ料金もかからないようになっています。

このキャッシュ機能を使いたくない場合は以下の手順を実行します。
1.展開をクリックスクリーンショット 2023-04-12 16.42.50.png
2.「キャッシュされた結果を使用」のチェックを外すスクリーンショット 2023-04-12 16.43.32.png

5. まとめ

以上のようにキャッシュ機能によって処理速度が高速化したりする便利な機能になっています。
次は今回のテーブルは一時的なキャッシュ結果テーブルの話なので宛先テーブルについて勉強した内容を記入していきたいと思います。

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?