概要
今回は、wgetを用いたデータセットのダウンロード方法とKaggleのAPIを用いたデータセットのダウンロード方法をまとめてみました。
wgetを用いてデータセットをダウンロード
例: CoCoデータセットをダウンロード
-
公式サイトにアクセスし、ダウンロードしたいファイルを右クリックして「リンクのアドレスをコピー」を選択します。
- サーバ上のターミナルで、以下のコマンドを実行して任意の場所にダウンロードします。
$ wget http://images.cocodataset.org/zips/train2014.zip
- ダウンロードしたzipファイルを展開するには、unzipコマンドを使用します。
$ unzip train2014.zip
Kaggleのデータセットをダウンロード
Kaggleのデータセットをダウンロードするには,KaggleのAPIを利用します (公式github)。
-
Kaggle APIのインストール
$ pip install kaggle
-
アカウント認証
-
データセットのダウンロード
- ダウンロードしたいデータセットのページにアクセスし、
ユーザ名/データセット名
をコピーします。 - 以下のコマンドを実行してデータセットをダウンロードします。
$ kaggle datasets download ユーザ名/データセット名
$ kaggle datasets download andrewmvd/lits-png
- ダウンロードしたいデータセットのページにアクセスし、