7
5

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 3 years have passed since last update.

AIRS-LabAdvent Calendar 2021

Day 4

KaggleのHouse Prices - Advanced Regression Techniquesをgoogle colabで動作させる手順

Last updated at Posted at 2021-12-04

初めに

  • kaggleのHouse Pricesのチュートリアルをgoogle colab上で行いたく。手順を下記にまとめてみました。

kaggleのAPI Tokenの取得

Kaggleにログインしてaccountページ「https://www.kaggle.com/<username>/account」 に遷移し、[Create API Token]をクリックすると、kaggle.jsonファイルがダウンロードされる。そしてgoogleドキュメントにkaggle.jsonファイルをアップロードする

手順

  • 画面右上のアイコンをクリックして「account」ボタンをクリックする

スクリーンショット 2021-12-02 16.47.25.png

  • 「Create New API Token」ボタンをクリックする
    スクリーンショット 2021-12-02 16.49.30.png

  • ダウンロードしたkaggle.jsonファイルの内容は下記になります。

{"username":"tsuyoshimoritalogic","key":"<生成されたAPI Token>"}
  • kaggle.jsonファイルをgoogleドライブの任意のフォルダに配置する
    スクリーンショット 2021-12-02 17.27.50.png

google colabでgoogleドキュメントをマウントする

  • google colabのcontentフォルダ内にdriveと言う名前でgoogleドキュメントをマウントする。下記のコマンドをgoogle colabで実行する
from google.colab import drive
drive.mount('/content/drive')
  • 実行すると下記の様にURLが表示されるので、そちらをクリックし、authorization codeが表示されたら、そのcodeをコピーして青枠の入力欄にコピーし、Enterを押すとマイウントされる。

スクリーンショット 2021-12-02 17.07.28.png

  • google colab上でcdコマンドを利用してマウントした対象のフォルダへ移動するとMyDriveというフォルダに移動して「ls -all」コマンドを実行するとgoogleドキュメントのファイルやフォルダを確認することができます。
    スクリーンショット 2021-12-02 17.23.26.png

  • kaggle.jsonを配置したパスを指定してcatコマンドを実行するとkaggle.jsonのファイルの中身を確認することができたので、正しくマウントできたことを確認することができる。私の場合、googleドキュメントの「Colab Notebooks」というフォルダにkaggle.jsonファイルを設置したので下記の様なパスの指定になっております。
    スクリーンショット 2021-12-02 17.29.40.png

gogole colabでkaggle apiを利用するための手順

  1. kaggleをインストールする
!pip install kaggle
  1. 「.kaggle」フォルダを作成する
!mkdir ~/.kaggle/
  1. googleドキュメントに配置したkaggle.jsonファイルを「.kaggle」フォルダにコピーする
!cp /content/drive/MyDrive/'Colab Notebooks'/kaggle.json ~/.kaggle/

4.パーミッションを600に変更する

!chmod 600 ~/.kaggle/kaggle.json

上記の手順をgoogle colabで実行するイメージは下記の様になります。
スクリーンショット 2021-12-02 17.41.36.png

google colab上でkaggleの住宅データをダウンロードする

  • 下記のコマンドを実行する。
!kaggle competitions download -c house-prices-advanced-regression-techniques

#### 上記のコマンドを実行した時に下記のエラーメッセージが表示された場合

Warning: Looks like you're using an outdated API Version, please consider updating (server 1.5.12 / client 1.5.4)
403 - Forbidden
  • 下記のコマンドを実行すると回避できる
!pip install --upgrade --force-reinstall --no-deps kaggle

上記のコマンドを実行した時に「403 - Forbidden」が表示された場合

スクリーンショット 2021-12-02 17.52.21.png

ダウンロードした住宅価格のデータを解凍する

  • 下記のコマンドを実行する。
!unzip /content/drive/MyDrive/'Colab Notebooks'/house-prices-advanced-regression-techniques.zip

※「kaggle competitions download」コマンドでダウンロードしたデータは現在、利用中のgoogle colabが置いてあるフォルダにダウンロードされる。

ダウンロードしたCSVファイルをpandaで読み込み

  • 下記のコマンドを実行しデータフレームの内容が表示されたら、チュートリアルをようやく動かせる状態となる。
import pandas as pd

df = pd.read_csv("/content/drive/MyDrive/Colab Notebooks/train.csv")
print(df)

スクリーンショット 2021-12-02 18.06.39.png

## 次回

  • google colab環境でHouse Pricesデータを動かせる状態になったので、色々と検証していきたいと思います。
7
5
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
7
5

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?