データサイエンス100本ノックとは?
良さそうなものがありました。
データサイエンス初学者のための実践的な学習環境 「データサイエンス100本ノック(構造化データ加工編)」をGitHubに無料公開
動かし方はREADMEに書いてあるので、慣れている人は一瞬で動かせると思いますが、初心者だとちょっと戸惑いそうなので、メモがわりに動かし方を書いておきます。
データサイエンス100本ノック環境構築方法
やることは大きく以下の2つです。
- Dockerセットアップ
- Docker上で動かす
それぞれ説明していきます。
Dockerセットアップ
Dockerの概要とインストール方法は以下参照ください。
Docker上で動かす
READMEの通り、以下コマンド実行しましょう。
$ git clone https://github.com/The-Japan-DataScientist-Society/100knocks-preprocess
$ cd 100knocks-preprocess
$ docker-compose up -d --build
全部完了したら、ブラウザで以下のアドレスにアクセスします。
http://localhost:8888
以下のような画面が表示されたらOKです。
「preprocess_knock_Python.ipynb」というファイルを選択すると、以下のようにJupyter Notebookが実行できます。
あとはEnjoyしましょう!
まとめ
Macでデータサイエンス100本ノックを動かす方法をメモがわりに簡単に紹介してみました。
データ分析の100本ノックはやるかは正直分からないのですが、それよりDockerでこうやって環境構築できることを知れたのが良かったです。固定した環境とセットでGitHub上でJupyter Notebookを公開できるのは、再現性が高そうで便利ですね。
参考リンク
データサイエンス100本ノックやってみる(環境構築)
Windowsの場合の情報
データサイエンス100本ノックを、Google ColabとAzure Notebooksで気軽に行いたい!
Google ColabやAzure Notebooksで動かしたい人向け
だから僕はpandasをやめた【データサイエンス100本ノック(構造化データ加工編)篇 #1】
だから僕はpandasをやめた【データサイエンス100本ノック(構造化データ加工編)篇 #2】
【Python】データサイエンス100本ノック(構造化データ加工編) 001-010 所感+解説リンクまとめ
Juliaでデータサイエンス100本ノック(構造化データ加工編)
Juliaでやってみた例。Juliaに関しては「高速な科学計算言語「Julia」入門」を参照ください。
関連ページ
変更履歴
- 2020/08/02 参考リンク追記
- 2020/07/02 参考リンク追記
- 2020/06/21 参考リンク追記
- 2020/06/17 関連ページ追記