LoginSignup
9
9

More than 5 years have passed since last update.

【入門編】Google ColaboratoryとローカルJupyterNotebookを使う

Posted at

まえおき

Google ColaboratoryはJupyterNotebook環境が無料で利用できるサービスです。ソースへのコメントをMarkdown形式で書き記せますので、ソースファイルを共有したりブログ投稿などもしやすいようになっています。

toukoudata01_exceldata00_1.jpg

JupyterNotebookはipynbというファイル形式で保存されます。Google Colaboratoryは一定時間(12時間)で環境がリセットされるため、定期的に保存が必要です。

toukoudata01_exceldata00_2.jpg

ソースと記事を書くのに夢中になって、ローカルへの保存を忘れるとガッデムなことになるので注意します。

Google Colaboratory

新たにノートブックを作成し、その上でプログラムを行います。

toukoudata01_exceldata00_3.jpg

やはりここから始めましょう、お決まりの以下を実行しましょう。新しいノートブックのセル内に以下を入力します。

toukoudata01_exceldata00_4.jpg

print('Hello,World!')

プログラムの実行は、shiftキーを押しながらEnterキーを押します。

実行結果>>>Hello,World!

表示されました。今度は変数HWに代入してHello,World!を表示させてみます。

HW = 'Hello,World!'
print(HW)

実行結果>>>Hello,World!

月並みですが、計算もやってみます。

a = 5
B = 3
a + B

実行結果>>>8

Pythonを使って行いたいこと、それはもはやIT業務の基礎知識なのかも、と思うほど耳にすることば、機械学習。
Excelで表計算をするように、Python環境で機械学習、しいては分析や予測がどの企業も通常業務内で行うことになるくらい、基本機能になる日も遠くないと感じます。
さて、
とにかく何はともあれ、既存データを読み込んで何かを行っていく、といったことがおおよそイメージできます。
まずはよくあるシーンの想定として、csvファイルを読み込んでみます。
読み込むデータは、以下のExcelのCSVファイル。

toukoudata01_exceldata01.jpg

Excelで作ったCSVデータは、そのままではPythonで使うには都合のよくない文字コード形式となっています。

メモ帳でファイルを開いて、あらためて以下のように文字コードをUTF-8に変更して保存します。

toukoudata01_exceldata02.jpg

ここで一つ考える

作成したファイルは、このGoogle Colaboratoryの環境で操作して進めていきたいですね。しかしそれはこのままでは出来ません。

何故ならGoogle Colaboratoryは、Webブラウザ上で誰もが手軽にPython環境を扱えるように作られた仮想環境のため、その環境上でPCローカル環境に保存したファイルを扱う権限を持つことは、セキュリティ上問題があるからです。

それではどうするのか、

Google Colaboratoryはその場合の対処方法も示してくれています。PCローカルに保存されたファイルを扱う場合、Webブラウザで操作していたJupyterNotebookをPCにインストールすることで、ローカル環境で操作を続けることができます。

JupyterNotebookのインストールは、まず下記「接続」メニューの「ローカルランタイムに接続...」を選択します。

toukoudata01_exceldata03.jpg

以下の画面が表示されるので、「こちらの手順に」をクリックしてJupyterNotebookのインストール手順を表示します。

toukoudata01_exceldata04.jpg

ローカルランタイムの説明画面が表示されていますので、説明を確認します。先ほど述べたセキュリティ上の問題も書かれていますので、記載内容を確認して設定の手順に示されている設定を進めます。

toukoudata01_exceldata05.jpg

設定の手順

画面記載の手順に従って、PCにJupyterNotebookをインストールしていきます。

手順1:Jupyterをインストールする

ローカルマシンにJupyterをインストールするため、「Jupyter」部分をクリックするとリンク先に飛び、Jupyterのサイトが表示されます。
このサイトを見ると、JUpyterをインストールするには、Anacondaというディストリビューションソフトをインストールする必要があると書いてあります。

Anacondaのインストールは別途記載の「AnacondaをインストールしJUpyterNotebookを使う」を参照してください。

toukoudata01_exceldata07_1_Jupyterinstall.jpg
toukoudata01_exceldata07_2.jpg

アイコンをダブルクリックし起動すると、以下のGoogle ColaboratoryのようなJupyterNotebookの画面が表示されます。

toukoudata01_exceldata07_3.jpg

以降の内容は、すでにAnacondaをインストールし、JupyterNotebookがローカルで開く環境を前提に記載しています。

補足事項

以降の設定手順2~手順4は、ローカルのJupyterNotebookと、ブラウザ利用のGoogle Colaboratoryを連携させるための設定です。

ですが、「Google ColaboratoryはWebブラウザ上で簡易にWeb上のデータを使って利用」とし、「ローカルデータの操作はローカルのJupyterNotebookを利用」として用途により使い分けるのであれば、以降の設定2~設定4は必要ありません。

そのため、設定2~設定4は詳細を省略します。

後述の「ローカルのJupyterNotebookを使う」まで読み飛ばしても構いません。

手順2: Jupyter 拡張機能 jupyter_http_over_ws をインストールして有効にする(1 回のみ)

手順に従い、「Github」の部分をクリックし、表示されたサイトから該当のファイルを入手します。
toukoudata01_exceldata08.jpg
入手した「 jupyter_http_over_ws 」をインストールするため、ローカルPCのJupyterの画面から手順2の以下コマンドを入力し、実行します。

pip install jupyter_http_over_ws
jupyter serverextension enable --py jupyter_http_over_ws

手順3:サーバーを起動して認証する

手順通りにノートブックサーバーを起動してフラグの設定を行います。ポート番号は記録しておきます(最初の設定では8888となっています)。

手順4:ローカルランタイムに接続する

手順に従い、Colaboratoryで「接続」ボタンの「ローカルランタイムに接続」を選択します。表示された画面に記録しておいたポート番号を入力して「接続」ボタンをクリックします。これでローカルのJupyterNotebookとColaboratoryが接続されます。

※以降の説明はPCに個別にJupyterNotebookをインストール(Anacondaというディストリビューションソフトをインストールすることで利用可)して、ローカル環境のみでJupyterNotebookを操作したものです。

基本的にはColaboratory上での操作と変わりませんので、適宜読み替えてください。

ローカルのJupyterNotebookを使う

現在、どのディレクトリ(フォルダ)に居るのか、表示を確認しておきます。

右側にある「NEW」メニュープルダウンから「Folder」を選択します。
toukoudata01_exceldata09.jpg

新たに「Untitled Folder」が作成されます。

フォルダ名を変更するため、左側のチェックボックスにチェックを入れて、「Rename」メニューを押します。
toukoudata01_exceldata10.jpg

任意のフォルダ名を入力して、「Rename」ボタンを押します。ここではMydataというフォルダ名にしました。
toukoudata01_exceldata11.jpg

フォルダをクリックしてフォルダ内を表示します。新しいフォルダですので、中身は何もありません。
toukoudata01_exceldata12.jpg

新たに作ったこのフォルダ内に、作っておいたCSVファイルを置きます。
toukoudata01_exceldata13.jpg

新たに「NEW」メニューから「Python3」の選択して新たなJupyterNotebookを開きます。
toukoudata01_exceldata14.jpg
toukoudata01_exceldata15.jpg

以下のコードを赤枠のセル内にコピーします(CSVファイル名は先ほど置いたファイル名に変更)。
Shiftキーを押しながらEnterキーを押して実行します。

import pandas as pd
data = pd.read_csv('pythondata01.csv')
data

以下のようにCSVデータ内容がJupyterNotebook上に表示されます。
toukoudata01_exceldata17.jpg

CSVファイルをJupyterNotebook上に読み込んで表示することが出来ました。

このようにして、既存のデータをPythonのJupyterNotebookに読み込み、操作することができます。

次回は作成した表形式内のデータの操作方法を紹介します。

9
9
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
9
9