はじめに
Kaggleに参加して数週間。Kaggle内をさまよったり、Youtubeで入門動画をみたりして
どうやってコンペに参加するのか、コンペってそもそも何なのか?など調べた。
で、自分なりにKaggleのコンペにデータを提出する方法はいくらかあることまではわかった。
1.Kaggleが提供するKernelでデータを作って提出する
2.MyPCでデータを作って、提出する
3.VPC(AWSやGCPなど)でデータを作って提出する。
最初は3.でしかデータ提出できないとおもってたけど、1.でも出せる方法を知り
これがやり方がわかるととても便利で使いやすいことがわかったのでメモに残す。
参考サイト
コンペのデータ提出にあたって参考にさせてもらいました。
https://note.mu/toshioakaneya/n/na582cb273153
前提
Kaggleに登録済みの人が前提です。
登録の仕方については別の記事を探してください。
まぁ。。。TOP画面行くと、登録の案内があり、そこでGoogleアカウントと連携するだけなのでそんなに難しくないですけど。
手順
- コンペに参加する
- KernelでNotebookを作成する
- Notebook上で提出データを作る
- 提出データをコンペに提出する
今回は、House Prices: Advanced Regression Techniques(https://www.kaggle.com/c/house-prices-advanced-regression-techniques)
を題材に説明。
1. コンペに参加する
お手本画像はすでに参加済みなので別物になっているけど
これから参加するコンペであれば「Join Competition」となっているのでクリック
2. KernelでNotebookを作成する
コンペの説明画面に移る。
ここで[Kernel]タブをクリックし、[New Notebook]クリック
Notebookの編集画面表示。
Notebookの名前はデフォルトだと適当な名前になるが、名前をクリックすると簡単に編集できる。
NotebookのつくりはJyupiterNotebookと一緒なので細かい説明は割愛。
右側のペインはNotebookの実行環境・性能を表示しているのでまぁ参考までに。
デフォルトで書かれているScriptをクリックすると、
ディレクトリ構造を表示してくれる。inputディレクトリにコンペのテストデータ類が
予め取り込まれた状態になっている。親切。
3. Notebook上で提出データを作る
コンペ次第だとは思うけど、今回題材にした「House Prices: Advanced Regression Techniques」では
inpuディレクトリに提出データのお手本がある。
すごい強引だけどこれを提出データとして提出する。
普通の試験だとシバかれるけどKaggle的には全く問題なし。懐が深い。
お手本データをそのまま提出データにするスクリプトがコチラ
# ファイルの読み出し
submission = pd.read_csv('../input/sample_submission.csv')
# ファイルの書き出し
submission.to_csv('submission.csv', index=False)
やってることは、ファイルのコピーでも十分なんだけど
一応、データ提出を想定したお手本なので、学習モデルを使って提出データを作って
それをコンペの提出データ用にcsv形式で出力した、という流れをイメージして
to_csv()メソッドを使っている(つもり)
できたかどうか見てみよう。ってことで確認スクリプトを実行
for dirname, _, filenames in os.walk('./'):
for filename in filenames:
print(os.path.join(dirname, filename))
これはカレントディレクトリ上のファイルを確認してる。
さっきCSV出力した提出データはここに置かれていることがわかる。
ちなみにこの場所にファイルを置いてないと、このあとの提出画面で提出データを認識してくれないっぽい。
4. 提出データをコンペに提出する
ようやく念願のデータ提出。作っただけだとダメでちゃんとCommitする。
Commitがおわったら、こんな感じになるので「Open Version」でNotebookのTOPへ移動する。
もちろん「return to editor」を教えて別ルートからNotebookのTOPへ移動してもOK
Output欄にジャンプする。
Output Filesの箇所に先ほど作成したsubmission.csvがあり、「Submit to Competition」が
アクティブ化しているのでコイツをクリック。
これで提出完了。
赤丸部をクリックすると、自分の順位の箇所へジャンプする。
今回の例はお試しということもあり自己ベストを越えなかったこともありちょっと出るところが
思った場所に出なかったけど、こんな感じで自分のランキングの場所へ飛んでくれる。
~おしまい~