データサイエンス100本ノックとは?
良さそうなものがありました。
データサイエンス初学者のための実践的な学習環境 「データサイエンス100本ノック(構造化データ加工編)」をGitHubに無料公開
動かし方はREADMEに書いてあるので、慣れている人は一瞬で動かせると思いますが、初心者だとちょっと戸惑いそうなので、メモがわりに動かし方を書いておきます。
データサイエンス100本ノック環境構築方法
やることは大きく以下の2つです。
- Dockerセットアップ
- Docker上で動かす
それぞれ説明していきます。
Dockerセットアップ
Dockerの概要とインストール方法は以下参照ください。
Docker上で動かす
READMEの通り、以下コマンド実行しましょう。
$ git clone https://github.com/The-Japan-DataScientist-Society/100knocks-preprocess
$ cd 100knocks-preprocess
$ docker-compose up -d --build
全部完了したら、ブラウザで以下のアドレスにアクセスします。
http://localhost:8888
以下のような画面が表示されたらOKです。
![data_01.png](https://qiita-user-contents.imgix.net/https%3A%2F%2Fqiita-image-store.s3.ap-northeast-1.amazonaws.com%2F0%2F81919%2F29dd4a06-839a-71be-6ec8-837c553ad057.png?ixlib=rb-4.0.0&auto=format&gif-q=60&q=75&s=cd922c46d3306b3452be96e760d12b09)
「preprocess_knock_Python.ipynb」というファイルを選択すると、以下のようにJupyter Notebookが実行できます。
![data_02.png](https://qiita-user-contents.imgix.net/https%3A%2F%2Fqiita-image-store.s3.ap-northeast-1.amazonaws.com%2F0%2F81919%2Feebb88bf-205e-3fad-93ad-253843753036.png?ixlib=rb-4.0.0&auto=format&gif-q=60&q=75&s=ec279b6ffe6e2ed6e7b4976bf5c2868e)
あとはEnjoyしましょう!
まとめ
Macでデータサイエンス100本ノックを動かす方法をメモがわりに簡単に紹介してみました。
データ分析の100本ノックはやるかは正直分からないのですが、それよりDockerでこうやって環境構築できることを知れたのが良かったです。固定した環境とセットでGitHub上でJupyter Notebookを公開できるのは、再現性が高そうで便利ですね。
参考リンク
データサイエンス100本ノックやってみる(環境構築)
Windowsの場合の情報
データサイエンス100本ノックを、Google ColabとAzure Notebooksで気軽に行いたい!
Google ColabやAzure Notebooksで動かしたい人向け
だから僕はpandasをやめた【データサイエンス100本ノック(構造化データ加工編)篇 #1】
だから僕はpandasをやめた【データサイエンス100本ノック(構造化データ加工編)篇 #2】
【Python】データサイエンス100本ノック(構造化データ加工編) 001-010 所感+解説リンクまとめ
Juliaでデータサイエンス100本ノック(構造化データ加工編)
Juliaでやってみた例。Juliaに関しては「高速な科学計算言語「Julia」入門」を参照ください。
関連ページ
変更履歴
- 2020/08/02 参考リンク追記
- 2020/07/02 参考リンク追記
- 2020/06/21 参考リンク追記
- 2020/06/17 関連ページ追記