Google ColabでKaggleのデータセットをダウンロードする際、以前はkaggle.jsonをダウンロードすることで利用することができ、そちらの方法がよく紹介されていました。
しかし、2026年現在では認証方法が変更されており、kaggle.jsonを用いる方法は推奨されていません。
公式GitHubでは、kaggle.jsonを用いる方法は "Legacy API credentials file" として紹介されており、新しく環境を構築する場合は API Token を利用する方法が推奨されています。
今回は推奨されている方法の中で最も簡単なkagglehub.login()を紹介します。
詳しくは公式ドキュメントを参照してください。
推奨方法(kagglehub.login())
- kaggleのSettings → API Tokensを開く
- API Tokens (Recommended)のGenerate New Tokensをクリック
- NEW TOKEN NAMEを適当に入力 → Generateをクリック
- 表示されたAPI Tokenをコピーして保存する
次に、GoogleColab上で以下を実行します。
import kagglehub
kagglehub.login()
API Tokenの入力を求められるので、先ほど保存したTokenを貼り付けます。
認証が完了すれば、その後は通常どおりデータセットをダウンロードできます。
例えばこんな感じでデータをダウンロードできます。
!pip install -q kagglehub
import os
import pandas as pd
# ダウンロードされたデータセットが保存されているディレクトリのパス
path = kagglehub.dataset_download("zynicide/wine-reviews")
# ダウンロードされたファイルを確認
print(os.listdir(path))
# 確認したCSVを読み込む
df = pd.read_csv(os.path.join(path, "winemag-data-130k-v2.csv"))


