google colabのノートブックを使って、Kaggleのコンテストの分析を行う時がある。
その第一歩、データの保存手順を記入しておく。
参考になれば幸いです。
1. Kaggle API Tokenの取得
[Kaggle]
Kaggleマイアカウントページ → 「your account」 → 「Create New API Token」をクリック
すると、「kaggle.json」のファイルがダウンロードされる。
※以前API Tokenを使った場合、一度「Expire API Token」をクリックし、以前のTokenを失効させた方がトラブルが減るかも
2. Google Colabの準備
ノートブック開き(または作成し)、以下を記入し、実行させる
- ! pip install -q kaggle
- from google.colab import files
- files.upload()--------ダウンロードされたkaggle.jsonを選択し、アップロードする。
- ! mkdir ~/.kaggle
- ! cp kaggle.json ~/.kaggle/
- ! chmod 600 ~/.kaggle/kaggle.json
- ! kaggle datasets list ------現在kaggle持ちのデータセットのリストが表示される
3.コンペのデータをダウンロード
- ! kaggle competitions download -c '「コンペ名」' -----データのzipファイルがダウンロードされる
※https://kaggle.com/competitions/「コンペ名」
zipファイルを「example_dir」フォルダに解凍する
2) ! mkdir example_dir ------
3) ! unzip 「コンペ名.zip」 -d example_dir