概要
この記事をやります。
上の記事で動かなかったらこのqiitaの記事を見てください。
主にやることは以下です。
- kaggleのAPI keyを取得する(kaggle.jsonの取得)
- googledriveをgooglecolabにマウントする。
- driveにkaggle.jsonをアップロードし、pathを指定してcolabからアクセスする。
- kaggle.jsonとpythonのkaggleを用いてデータのダウンロード
1. kaggleのAPIkeyを取得
-
kaggleのホームで右上の自分のアイコンをクリック
-
出てきたタブのyour profileをクリック
-
下にスクロールし、APIの場所でcreate new api tokenをクリック
これでkaggle.jsonがダウンロードできる。
2. googledriveをgooglecolabにマウントする。
適当なnotebook作って、以下を打ち込み、指示に従ってkeyを入力
# Mount google drive
from google.colab import drive
drive.mount('/gdrive')
3. driveにkaggle.jsonをアップロードし、pathを指定してcolabからアクセスする。
今回はMy Driveのルートにkaggleというフォルダを作りそこに先ほどダウンロードしたkaggle.jsonをアップロードする。
/My drive/kaggle/kaggle.json
のようになれば良い。
2でマウントした際に/gdrive
の上にMy driveをマウントしたことになるので、kaggle.jsonにアクセスする際には/gdrive/My Drive/kaggle/kaggle.json
からアクセスできる。
4. kaggle.jsonとpythonのkaggleを用いてデータのダウンロード
!pip install kaggle
これを行ってkaggleコマンドのインストール
あとは以下のコマンドで、kaggleフォルダに移動し、kaggleコマンドを使ってデータをダウンロード
# Import OS for navigation and environment set up
import os
# Enable the Kaggle environment, use the path to the directory your Kaggle API JSON is stored in
os.environ['KAGGLE_CONFIG_DIR'] = '/gdrive/MyDrive/kaggle'
# Navigate into Drive where you want to store your Kaggle data
os.chdir('/gdrive/MyDrive/kaggle')
# # Paste and run the copied API command, the data will download to the current directory
!kaggle datasets download -d prasunroy/natural-images
# # Check contents of directory, you should see the .zip file for the competition in your Drive
os.listdir()