LoginSignup
3
2

More than 1 year has passed since last update.

googlecolabでkaggleのデータをダウンロードする。

Posted at

概要

この記事をやります。
上の記事で動かなかったらこのqiitaの記事を見てください。

主にやることは以下です。
1. kaggleのAPI keyを取得する(kaggle.jsonの取得)
2. googledriveをgooglecolabにマウントする。
3. driveにkaggle.jsonをアップロードし、pathを指定してcolabからアクセスする。
4. kaggle.jsonとpythonのkaggleを用いてデータのダウンロード

1. kaggleのAPIkeyを取得

  • kaggleのホームで右上の自分のアイコンをクリック
  • 出てきたタブのyour profileをクリック
  • 自分のプロファイルの下の列でaccountをクリック
    スクリーンショット 2021-10-19 16.33.58.png

  • 下にスクロールし、APIの場所でcreate new api tokenをクリック

スクリーンショット 2021-10-19 16.35.46.png

これでkaggle.jsonがダウンロードできる。

2. googledriveをgooglecolabにマウントする。

適当なnotebook作って、以下を打ち込み、指示に従ってkeyを入力

# Mount google drive
from google.colab import drive
drive.mount('/gdrive')

3. driveにkaggle.jsonをアップロードし、pathを指定してcolabからアクセスする。

今回はMy Driveのルートにkaggleというフォルダを作りそこに先ほどダウンロードしたkaggle.jsonをアップロードする。
/My drive/kaggle/kaggle.jsonのようになれば良い。
2でマウントした際に/gdriveの上にMy driveをマウントしたことになるので、kaggle.jsonにアクセスする際には/gdrive/My Drive/kaggle/kaggle.jsonからアクセスできる。

4. kaggle.jsonとpythonのkaggleを用いてデータのダウンロード

!pip install kaggle

これを行ってkaggleコマンドのインストール

あとは以下のコマンドで、kaggleフォルダに移動し、kaggleコマンドを使ってデータをダウンロード

# Import OS for navigation and environment set up
import os
# Enable the Kaggle environment, use the path to the directory your Kaggle API JSON is stored in
os.environ['KAGGLE_CONFIG_DIR'] = '/gdrive/MyDrive/kaggle'

# Navigate into Drive where you want to store your Kaggle data
os.chdir('/gdrive/MyDrive/kaggle')
# # Paste and run the copied API command, the data will download to the current directory
!kaggle datasets download -d prasunroy/natural-images
# # Check contents of directory, you should see the .zip file for the competition in your Drive
os.listdir()

3
2
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
3
2