はじめに
国勢調査データに基づいた分類モデルの構築と使用をやってみた。
大まかなStep
- モデル作成
- モデル評価
- モデルを使って予測
1. モデル作成
ステップ 1: モデルを格納するためのデータセットを作成する。
最初のステップとして、モデルを格納する BigQuery データセットを作成します。
ステップ 2: データを確認する。
このステップでは、データセットを確認して、ロジスティック回帰モデルのトレーニング データとして使用する列を特定します。
ステップ 3: トレーニング データを選択する。
次に、census_adult_income テーブルに対してクエリを実行して、2 項ロジスティック回帰モデルのトレーニングに使用するデータを準備します。 このステップでは、関連性のある特徴を特定し、その後のクエリで入力データとして使用するためにビューに保存します。
ステップ 4: ロジスティック回帰モデルを作成する。
ステップ 4 では、CREATE MODEL ステートメントを使用してロジスティック回帰モデルを作成します。
2. モデル評価
ステップ 5: ML.EVALUATE 関数を使用してモデルを評価する。
次に、ML.EVALUATE 関数でモデルの性能に関する統計を取得します。
3. モデルを使って予測
ステップ 6: ML.PREDICT 関数を使用して回答者の所得を予測する。
最後に、ML.PREDICT 関数を使用して、特定の国勢調査回答者の所得階層を予測します。