概要
Kaggleのアカウントを作成して、サンプルデータを提出するまでの手順です。
ゴール
タイタニックコンペのサンプルデータを提出するまでを行います。
Kaggleとは
Kaggle(カグル)とは、データサイエンスや機械学習のコンペティションを提供するプラットフォームです。
用意された課題・データセットを基にモデルを構築し、予測精度を競い合うことで、他のデータサイエンティストの手法を学びながら、実践的な経験を積むことができます。
タイタニック生存者予測とは
タイタニック生存者予測とは、Kaggle入門として有名なコンペで、タイタニック号の乗客データを用いて、乗客が生存したかどうかを予測するコンペです。
※本記事は予測モデル構築は行わず、用意されているテストデータの提出までを行います。
手順
以下より、Kaggleのアカウントを作成し、入門コンペとして最もメジャーである「タイタニックの生存者予測」のサンプルデータ提出までを行っていきます。
1. Kaggleのアカウント作成
- Kaggleのウェブサイトにアクセスします
- "Register" > "Register with Email"の順にクリックして進みます
- ユーザー名、メールアドレス、パスワードを入力します
⇒ メールアドレスの認証ができたら、アカウント作成は完了です
2. タイタニック生存者予測のサンプルデータ提出
-
コンペティションページ内にある「Data」タブから、"Download All"をクリックし、提供されているデータセットをダウンロードします
-
ダウンロードした"titanic.zip"を展開します
-
コンペティションページ内にある「Submissions」タブから、"Submit Prediction"をクリックします。
-
「Submissions」タブ内の"Drag and drop file to upload"と書かれている場所に、展開したzip内の"gender_submission.csv"のファイルをドロップして"Submit"をクリックします。
⇒以下の画面が表示されたら、サンプルデータの提出は完了です。
まとめ
今回はKaggleのアカウントを作成し、サンプルデータの提出までを行いました。
今回提出した「gender_submission.csv」は男性は全員死亡し、女性は全員生存したという単純な回答になっていて、約76%の精度となっています。
次回以降、より精度を上げるためにモデル構築などを行っていきたいと思います。