こんにちは!GASを使った業務効率化に夢中の初心者プログラマー、太郎です!
最近、GASから離れて機械学習の勉強をしています。最初に選んだ本はオライリージャパンさんから出版されている『ゼロから作るDeepLearning~Pythonで学ぶDeepLearningの理論と実装』!(本当に初学者向けかは不明・・・)
この本では、基本的にanacondaを使ってローカルな環境で開発することが想定されているのですが、クラウド上で出来ると楽だなと思い、GoogleColaboratoryで動かしてみることに決めました。
ほとんどは同じコードで動くのですが、いくつか変更しなければならないところがあったため、初学者の方向けにその方法をまとめておきたいと思います。
そもそもGoogleColaboratoryとは?
Googleが無料で提供してくれている、機械学習のための開発環境です。特徴は以下
- JupyterNotebookに似たインターフェース(つまり使いやすい)
- 主要なライブラリがインポート済み(つまり使いやすい)
- GPUが無料で使える(CPUよりも計算速度がバリ早い)
などなど、初学者やハイスペックなPCを持たない人が簡単に機械学習に触れられるような環境となっているのです。しかも無料!!!
まだ開発環境についてあまり詳しくないので、他のデメリットとか、AIアプリを開発するときに使えるのかなどは分からないのですが、、、とりあえず機械学習を勉強してみたい!という方には非常にお勧めです!!!
githubからサンプルファイルをダウンロードする
そんなわけで、ゼロから作るDeepLearningをGoogleColaboratory上で勉強するための準備をしていきましょう。
まずは、オライリージャパンのGitHubにアクセスし、ソースコードをダウンロードします。
そして、CodeのところからZIPファイルをダウンロードします。
ダウンロードしたファイルは解凍しておきましょう。
ダウンロードしたファイルをGoogleDriveにアップ
次にドライブに解答したフォルダをアップロードします。
これだけです。
##ドライブをマウントする
ここからが少し特殊です。マイドライブ上で良いので、GoogleColaboratoryのファイルを一つ作成しましょう。
ただ、このままだとドライブにある他のファイルにアクセスができないのでマウントという作業をします。
このようなコードを書いてセルを実行しましょう。
実行すると、「このURLにクリックしなさい」と求めらます。
クリックして、使用するアカウントを選択、「許可」を押すとマウントするためのコードが発行されます。
このコードを入力すれば、マウント完了です!
画面の左側のフォルダを開くと、MyDriveと表示されていることも確認しましょう。
ちなみに、接続が切れるたびに、このマウントは実行する必要があります。
ファイルへのパスを通して、モジュールをインポート
ダウンロードしたファイルの階層はざっくりこんな感じです。
deep-learning-from-scratch-master
├── ch01
├── ch02
・
・
・
├── ch08
├── common
│ ├── function.py
│ ├── gradient.py
│ └── 他
└── dataset
├── minst.py
└── 他
機械学習に使用するデータセットをダウンロードするには、mnist.pyの中のload_mnist関数をインポートする必要があります。
本の中では、sysとosライブラリをインポートして以下の様にモジュールをインポートしています。
import sys, os
sys.path.append(os.pardir)
from dataset.mnist import load_mnist
colaboratory上だと上記のpathではインポートが出来ません。
osを使わずに以下の様に記述します。
import sys
sys.path.append('/content/gdrive/My Drive/deep-learning-from-scratch-master/dataset')
from mnist import load_mnist
※『deep-learning-from-scratch-master』フォルダがマイドライブの直下にある場合
『common』フォルダにある他のpyファイルも同様にパスを通せばアクセスできます!
他の書き方もきっとあるのでしょうが、上記の部分を変更してあげれば、名著『ゼロから作るDeepLearning』をGoogleColaboratory上で学習することができます!
以上、参考になれば嬉しいです!
追記:インポートしたいモジュールの中にも他のファイルを参照する記述がある場合
モジュールの中にも他のファイルを参照する記述がある場合、上手く動かなくなります💦
その場合、該当のpyフォルダのファイルパスの部分をGoogleColaboratoryでの表記に変更し、変更したpyファイルをアップロードすれば、参照できるようになりました。
例えばこんな感じです。
【変更前】
import sys, os
sys.path.append(os.pardir) # 親ディレクトリのファイルをインポートするための設定
import numpy as np
from collections import OrderedDict
from common.layers import *
from common.gradient import numerical_gradient
【変更後】
import sys
sys.path.append('/content/gdrive/My Drive/GoogleColabo/0karaDeepLearning/common')
import numpy as np
from collections import OrderedDict
from layers import *
from gradient import numerical_gradient
変更しなければならないpyファイルは『commonフォルダ』内の、layers.py
、multi_layer_net.py
、multi_layer_net_extend.py
、trainer.py
の4つです。あとのpyファイルはせいぜいnumpyくらいしかインポートしてないので、修正いらずです。
きっともっといいやり方があるのだろうな~~~と思うので、やり方が分かる方がいれば教えてください>_<