LoginSignup
3
1

More than 3 years have passed since last update.

kaggle 上のデータセットを cli でダウンロードする

Posted at

kaggle のデータセットをダウンロード

ブラウザ経由でダウンロードしてもよいが、
GUIを触りたくなかったり、スクリプト化するときにはCLIの方が便利なので
メモ用として記載。

ダウンロードには公式の kaggle-apiを利用する
https://github.com/Kaggle/kaggle-api

kaggle-api のインストール

kaggle 公式の cli ツール

pip install kaggle --upgrade

認証情報の登録

以下にアクセスし、
https://www.kaggle.com//account
API > Create New API Token をクリック

image.png

kaggle.json をダウンロードし、
~/.kaggle/kaggle.json へ配置
アクセス権限を変更
chmod 600 ~/.kaggle/kaggle.json

あるいは、内容を export しても良い

export KAGGLE_USERNAME=datadinosaur
export KAGGLE_KEY=xxxxxxxxxxxxxx

download

Usage:

kaggle competitions {list, files, download, submit, submissions, leaderboard}
kaggle datasets {list, files, download, create, version, init}

例: image-net のダウンロード

以下のページにアクセスして、利用規約に同意を行う
https://www.kaggle.com/c/imagenet-object-localization-challenge/data

以下のコマンドを実行

kaggle competitions download -c imagenet-object-localization-challenge

必ずしも、 kaggle datasets download コマンドを利用するとは限らないので、
利用したいものがある場合、該当ページでダウンロード方法を確認すると良い

例 tiny-imagenet のダウンロード

kaggle datasets download akash2sharma/tiny-imagenet
3
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
3
1