【自分メモ】BigQuery MLのチュートリアルやってみた




  1. モデル作成
  2. モデル評価
  3. モデルを使って予測

1. モデル作成

ステップ 1: モデルを格納するためのデータセットを作成する。

最初のステップとして、モデルを格納する BigQuery データセットを作成します。

ステップ 2: データを確認する。

このステップでは、データセットを確認して、ロジスティック回帰モデルのトレーニング データとして使用する列を特定します。

ステップ 3: トレーニング データを選択する。

次に、census_adult_income テーブルに対してクエリを実行して、2 項ロジスティック回帰モデルのトレーニングに使用するデータを準備します。 このステップでは、関連性のある特徴を特定し、その後のクエリで入力データとして使用するためにビューに保存します。

ステップ 4: ロジスティック回帰モデルを作成する。

ステップ 4 では、CREATE MODEL ステートメントを使用してロジスティック回帰モデルを作成します。

2. モデル評価

ステップ 5: ML.EVALUATE 関数を使用してモデルを評価する。

次に、ML.EVALUATE 関数でモデルの性能に関する統計を取得します。

3. モデルを使って予測

ステップ 6: ML.PREDICT 関数を使用して回答者の所得を予測する。

最後に、ML.PREDICT 関数を使用して、特定の国勢調査回答者の所得階層を予測します。

