はじめに
この手の記事は腐るほどあるけど、自分の欲しい用途で素直にしっくりくるやつが
見つからなかったので、自分なりに整理しなおした
参考情報
入出力の方法
GoogleColaboratory(以下、colab)にはいくつか入出力のやり方があります。
1.ブラウザ経由でファイルアップロード/ダウンロード ← 今回はココ!
2.GoogleDriveからインポート/エクスポート
3.Googleスプレッドシートからインポート/エクスポート
入出力にあたっての注意点
ファイルをダウンロードをするには一度colabのローカルにファイル保存する必要がある。
なので、pandasのdataFrameを直接ダウンロードしたらcsv形式で
出力される。ということはできない。残念。
ただ、配列データ([1,2,3,4]みたいな)に限って言えば
③Googleスプレッドシートからインポート/エクスポート
が使える。逆に③は配列データでなければ使えない。一長一短。
1.ブラウザ経由でファイルアップロード/ダウンロード
ある意味、これがわかればもう自分が知りたいことは十分な感じなので一番最初に書く。
ローカルPCからColabへアップロード
from google.colab import files
files = files.upload()
file_name = list(files.keys())[0]
file_string = files[file_name].decode()
file_string
実行すると、ファイル選択フォームがあらわれるのでそこにファイルをD&D。
このファイルを読み込んでどうのこうのしたい場合は、毎度おなじみのopen()を使ってもいいけど
自分はcsvファイルをよく扱うpandasを使って読み込んでみて結果確認。
import pandas as pd
df = pd.read_csv('iris_dataset.csv')
df
アップロード成功~
ColabからローカルPCへダウンロード
ひとまず、Colabのローカル状況をチェック。
さっきUPしたiris_dataset.csv(黄色ハッチング部)をダウンロードする。
やり方は超簡単。
from google.colab import files
files.download('iris_dataset.csv')
結果がコチラ。
ダウンロード結果、ダウンロードされた場所、ダウンロードしたファイルの中身。
ぜんぶぶち込んだので混雑してるけどちゃんとできたことが確認できた。
ダウンロード成功~
おわりに
ブラウザ経由でデータのやり取りをするのは案外簡単。
コードをまじないのように覚えておくだけでも十分な気がする。
とはいえ、いちいち覚えておくのは辛いので折に触れてこの記事を読み返すことにしよう。