Python
Kaggle

kaggle-cliでデータをダウンロードする

追記

Kaggle公式のツールがでました。
以下で紹介するkaggle-cliより公式のものを使うことをおすすめします。


KaggleをAWSなどのクラウドで学習をまわす場合、データが数十GBもあると、ローカルにダウンロードしてからクラウドに送るのは大変ですよね。

そこで、kaggle-cliという便利なツールがあるので、紹介します。

インストール

$ pip install kaggle-cli

データのダウンロード

ユーザ名、パスワード、コンペ名を指定してダウンロードできます。

$ kg download -u <username> -p <password> -c <competition>

事前に、コンペのルールにacceptしていないとダウンロードできません。
Googleアカウントなどでログインしていてパスワードがない場合は、パスワードを設定する必要があります。

特定のファイルのみダウンロード

$ kg download -u <username> -p <password> -c <competition> -f train.zip

config設定

$ kg config -u <username> -p <password> -c <competition>

とすると、.kaggle-cli/にファイルが作成され、コマンドを実行するときにオプションが不要になります。

その他

その他、submitもできます。詳しくは、Githubのページを参照ください。