Google Drive上にデータセットを格納して、Google colabから読み書きする方法について
Kaggle上のデータセットを使って、Google Colab上で分析するために色々な手法を調べたのですが、超初心者のため荒技だけど一番簡単なこちらの方法を紹介します。
step1.Google Driveにマウントする。
コードは以下をアレンジなしでそのままコピペでOK!
from google.colab import drive
drive.mount('/content/drive')
実行するとこのような画面が出てくるので、[Googleドライブに接続]を押下
その後、googleアカウントの選択画面が出てくるので、Google Driveに接続したいGoogleアカウントを選択し、出てくるポップアップ画面は次へなどを選択していくと、先ほど実行したコードの部分がこのようになります。
"Mounted at /content/drive" このコメントはつまり、GoogleDriveにマウントが成功したという事です。
※マウントするとは?
外部のリソースを、自分のリソースで使えるようにする事(雑)。
つまり、Google Drive上のファイル(外部)を、Goolge Colab(自分のリソース)で使えるようにする事。
step2.Google Drive上の読み込みたいファイルのパスを取得する。
パスというのはPC上にあるファイルの住所のことです。
以前私は勘違いしていたのですが、このパスはGoogle Colab上から取得します。
つまり、Google Drive上にファイルがあるからと言って、Google Driveの画面に移動する必要はありません。
Google Colab画面上の左端にある、ファイルボックスのアイコンをクリック
するとフォルダが縦に並んだ画面が出てくるので、[drive]というフォルダのアイコンを押し、[MyDrive]というフォルダのアイコンをクリック。すると、自分のGoogle Driveと同じフォルダの構成が下に出てくるので、読み込みたいファイル名を見つけてドットマークを押すと、[パスをコピー]が出てくるのでクリック。
これで完了です
他にはこんな方法もあるようです
・KaggleデータセットをGoogle Colabで利用する方法
https://www.toolify.ai/ja/ai-news-jp/kagglegoogle-colab%E5%88%A9%E7%94%A8%E6%96%B9%E6%B3%95-2076048
・