概要
BigQueryをサービスに組み込みことになりそう...!
ということで、まずはBigQueryと仲良くなります。
スタートガイドをなぞって進めて行きます。
参考:GCP Console のウェブ UI を使用したクイックスタート
事前準備
- GCP プロジェクトを選択または作成します。
今回は、アカウント作成時に、作られた「My First Project」を利用します。
- 新しいプロジェクトでは、BigQuery が自動的に有効になります。
念の為、ドキュメントのリンクから有効化を押してみたところすでに有効とのこと。
一般公開のデータセットでクエリ実行
以下のURLから一般公開のデータセットにアクセス
https://console.cloud.google.com/bigquery?p=bigquery-public-data&page=project
シンプルなサンプルクエリを実行します。
SELECT
name, gender,
SUM(number) AS total
FROM
`bigquery-public-data.usa_names.usa_1910_2013`
GROUP BY
name, gender
ORDER BY
total DESC
LIMIT
10
おや...エラーが...
Access Denied: Project garnet-251305: User does not have bigquery.jobs.create permission in project garnet-251305.
どうやらアカウント切り替えなどで、プロジェクトが選択できていなかった様子
プロジェクトを選択して以下のように実行できました。
データセットの作成・テーブルの作成
こちらも手順通りに実施します。
ご丁寧にサンプルのデータセットが用意されているので、ダウンロードして解凍(赤ちゃん名前に関するデータですね。)
プロジェクト配下に、データセットを新規作成、続いてテーブルも作成します。
ガイドの中では、特に特別な設定などはしません。
あっというまにデータがインポートされてプレビューできる状態に!
続いてクエリを実行します。
SELECT
name,
count
FROM
`babynames.names_2014`
WHERE
gender = 'M'
ORDER BY
count DESC
LIMIT
5
こちらも簡単に実行できました。
クリーンアップ
GUIからの動作は試せたので、お片付けです。
プロジェクト内の最上位の単位であるデータセットをまるごと削除します。
データセットの設定から「データセットの削除」を選択
確認のためデータセット名を入力して削除完了!
お片付けまで簡単ですね。