初めに
- kaggleのHouse Pricesのチュートリアルをgoogle colab上で行いたく。手順を下記にまとめてみました。
kaggleのAPI Tokenの取得
Kaggleにログインしてaccountページ「https://www.kaggle.com/<username>/account」 に遷移し、[Create API Token]をクリックすると、kaggle.jsonファイルがダウンロードされる。そしてgoogleドキュメントにkaggle.jsonファイルをアップロードする
手順
- 画面右上のアイコンをクリックして「account」ボタンをクリックする
{"username":"tsuyoshimoritalogic","key":"<生成されたAPI Token>"}
google colabでgoogleドキュメントをマウントする
- google colabのcontentフォルダ内にdriveと言う名前でgoogleドキュメントをマウントする。下記のコマンドをgoogle colabで実行する
from google.colab import drive
drive.mount('/content/drive')
- 実行すると下記の様にURLが表示されるので、そちらをクリックし、authorization codeが表示されたら、そのcodeをコピーして青枠の入力欄にコピーし、Enterを押すとマイウントされる。
-
google colab上でcdコマンドを利用してマウントした対象のフォルダへ移動するとMyDriveというフォルダに移動して「ls -all」コマンドを実行するとgoogleドキュメントのファイルやフォルダを確認することができます。
-
kaggle.jsonを配置したパスを指定してcatコマンドを実行するとkaggle.jsonのファイルの中身を確認することができたので、正しくマウントできたことを確認することができる。私の場合、googleドキュメントの「Colab Notebooks」というフォルダにkaggle.jsonファイルを設置したので下記の様なパスの指定になっております。
gogole colabでkaggle apiを利用するための手順
- kaggleをインストールする
!pip install kaggle
- 「.kaggle」フォルダを作成する
!mkdir ~/.kaggle/
- googleドキュメントに配置したkaggle.jsonファイルを「.kaggle」フォルダにコピーする
!cp /content/drive/MyDrive/'Colab Notebooks'/kaggle.json ~/.kaggle/
4.パーミッションを600に変更する
!chmod 600 ~/.kaggle/kaggle.json
上記の手順をgoogle colabで実行するイメージは下記の様になります。
google colab上でkaggleの住宅データをダウンロードする
- 下記のコマンドを実行する。
!kaggle competitions download -c house-prices-advanced-regression-techniques
#### 上記のコマンドを実行した時に下記のエラーメッセージが表示された場合
Warning: Looks like you're using an outdated API Version, please consider updating (server 1.5.12 / client 1.5.4)
403 - Forbidden
- 下記のコマンドを実行すると回避できる
!pip install --upgrade --force-reinstall --no-deps kaggle
上記のコマンドを実行した時に「403 - Forbidden」が表示された場合
-
https://www.kaggle.com/c/house-prices-advanced-regression-techniques/rules
のURLにアクセスして頂き、「I Understand and Accept」ボタンをクリックしてください。
-
クリック後、下記のメッセージが表示されたら設定完了です。
ダウンロードした住宅価格のデータを解凍する
- 下記のコマンドを実行する。
!unzip /content/drive/MyDrive/'Colab Notebooks'/house-prices-advanced-regression-techniques.zip
※「kaggle competitions download」コマンドでダウンロードしたデータは現在、利用中のgoogle colabが置いてあるフォルダにダウンロードされる。
ダウンロードしたCSVファイルをpandaで読み込み
- 下記のコマンドを実行しデータフレームの内容が表示されたら、チュートリアルをようやく動かせる状態となる。
import pandas as pd
df = pd.read_csv("/content/drive/MyDrive/Colab Notebooks/train.csv")
print(df)
## 次回
- google colab環境でHouse Pricesデータを動かせる状態になったので、色々と検証していきたいと思います。