LoginSignup
5
7

More than 3 years have passed since last update.

データの集計は、GoogleColabratory使ったほうが100倍早い

Last updated at Posted at 2019-04-28

多分これが一番早いと思います

こちらの記事でデータ集計RTAをやられていたので私も参加したいと思います。

データの集計は、ExcelよりPython使ったほうが100倍早い(pandas-profiling, pixiedust)

個人的にRでやったほうがさらに早い気がします。

諸事情によりpixiedustの処理は省略しています、後日追記したいと思います。

TL;DR

  • GoogleColabratoryを利用してPython環境準備を簡単化
  • 手元のファイルをアップロードするとpandas-profilingが走るようにした

方法について

前提

作成済みJupyterNotebookをGoogleDriveへコピーする(所要時間3分)

GoogleColabratory - auto_padas_profiling.ipynbを自分のGoogleDriveへコピーする。

googlecolab_ipynb_copy.gif

全てのセルを実行する(所要時間5分)

googlecolab_run.gif

終わり

参考

5
7
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
5
7