Google Colaboratory(Colab)の使い方について2022年12月現在でまとめてみました。
本記事は、Jupyter Notebookは多少使ったことはあるけど(コードセル(Ptyhonコード)やテキストセル(markdown)はある程度理解している)、Colabを初めて使う方をターゲットにしています。
Colabの始め方
Googleコラボのインストールは、以下の手順で簡単に行えます。
- Googleアカウトを作成(まだ持っていない場合)
- Googleドライブ上で左上のメニューから「アプリで開く」->「アプリを追加」で、Googleコラボを選んでインストール
- Github等からアップロードしたNotebookファイル(.ipynb)を実行するとGoogleコラボが自動起動します
下記の動画も参考にしてください。 Colabで使用するJupyter Notebookの簡単な操作の説明も紹介されています。
最新の環境
ColabでのPythonのバージョン
コードセルで !python --version
コマンドを実行することで事前にインストールされているライブラリィを確認することができます。
Pythonは、3.7.15がインストールされています。
インストール済みライブラリィリスト
コードセルで !pip list
コマンドを実行することで事前にインストールされているライブラリィを確認することができます。
主なインストール済みライブラリィとバージョン
ライブラリィ | バージョン |
---|---|
numpy | 1.21.6 |
matplotlib | 3.2.2 |
pandas | 1.3.5 |
Pillow | 7.1.2 |
scikit-learn | 1.0.2 |
tensorflow | 2.9.2 |
注意すべきこと
Tensorflowのバージョンは 2.9.2 ですので、Tensorflow1.xで作成された様々な既存のコードは動かすことができません(CUDAのバージョン:V11.2.152)。
ただし、Tensorflow1.xの互換モードでは2022年11月末現在では動きますので、コードの先頭に下記のimport文を入れ必要な非互換部分のみ修正すれば動かすことが可能なことが多いです。
筆者がStyleGAN2で対応した事例を以下に紹介してますので参考になればと思います。
各種操作
新規NoteBookの作成
新しくノートブックを作成する際は、Googleドライブの「新規」 -> 「その他」 -> 「Google Colaboratory」で作成します(新しく作るのではなく既存のNotebookをテンプレとしてマイドライブにアップロードして使う方法もあります)。
Googleドライブのマウント
Google「マイドライブ」との接続(マウント)は以下のコマンドで行います。 Colab上のファイルはセッションが切れると自動で削除されてしまいます。そのため保存したいファイル(Notebook以外のGithubからクローンしてきたコード等)がある場合は、マイドライブをマウントして保存できるようにしましょう。
下記のコマンドをコードセルで実行します。
以下のダイアログが表示されますので、「Googleドライブに接続」を選択します。
使用するアカウントの選択ダイアログが表示されますので選択します。
各リソースにアクセスする同意を求められますので「許可」を選択します。
マイドライブのマウンドが完了すると「Mounted at /content/drive」が表示されます。
実際にマウントされたのかColabのディレクトリを見てみます。左サイドバーにあるフォルダのマークをクリックするとフォルダ構成が表示されます(Windowsのエクスプローラー風にグラフィックで表示されます)。
「drive」 $\to$ 「MyDrive」がマウントされ、マイドライブがアクセスできるようになっています。
- OSコマンドの使い方
OSコマンドは、先ほどPythonのバージョンを確認しように先頭に 「!
」 を付ければ実行できます。
また、iPyhonで持っている「マジックコマンド」でも同様の処理ができます。マジックコマンドは先頭に「%
」を付けて実行します。マジックコマンドの一覧は「%lsmagic
」で確認出来ます。
OSコマンドにあるコマンド(cd、ls、pwd..等)では基本できることは一緒です。マジックコマンドではNotebookならではの便利なコマンドがあります。
マジックコマンドの例
コマンド | 説明 |
---|---|
%time | コマンドセルでの実行時間の計測を行う |
%history | コードセルの実行履歴を一覧で取得する |
%autosave | Auto Saveの頻度を変更できる。(default120秒) |
%matplotlib inline | matplotlibでコードセル直下にグラフが描画される |
Colab上のファイルへのアクセス
Colab上のファイルへのアクセスは、Notebooke上からGUIで操作が出来ます。
ファイルをクリックすれば右サイドバーで中身の確認や編集が行えます。また右クリックでアップロードやファイル名の変更、削除等の各種の編集作業が行えます。
また、コードセルからUNIXのコマンドを使ったファイル操作も行えます。
Githubからコードのコピー
!git clone XXXX
でGuthubのコードをColba上に取り込めます(ただし、セッションが切れるとクリアされるので変更等を行う場合は注意(マイドライブにコピーして利用する等)が必要です)。
クローンに成功すると左サイドバーのファイルで見れるようになります。
リソースの表示と切り替え
使用しているメモリやCPU、GPUの状態は左上にある「▼(その他接続オプション)」をクリックし「リソースの状態」を選択することで確認できます。
CPUおよびGPUの切り替えは、「ランタイム」 $\to$ 「ラインタイムのタイプを変更」を選択し、表示された「ノートブックの設定」ダイアログの「ハードウェアアクセラレータ」で選択します(GPU/TPUの使用時間には制限があります)。
おわりに
PythonやNumpyをきちんと理解したい人向けに、Google Colba上で動かせるチュートリアルを以下に公開しています。 よろしかったら使ってみてください。
- Pythonチュートリアル
- Numpyチュートリアル
- Pandasチュートリアル
誤りや不足、加筆修正すべきところがありましたらぜひご指摘ください。継続してブラッシュアップしていきます。
© 2022 NPO法人AI開発推進協会