データコンサル仕事してると、DBからテキトウに取ってきた値とかを、Jupyterの中でPandasでサマって客の目の前で可視化とかする事多いので、最終段の可視化周りをまとめる。
ここに上げたやつ使ってればまぁ大体の業務はカタつくとおもう。使い方はそれぞれTutorialを参考。そんな難しくない。
matplotlib
基本のライブラリ。みんな使ってる
seaborn
matplotlibをベースに、統計解析結果を見た目よく可視化をしてくれるライブラリ。デンドログラムとかも書ける。pandasと連携可。
bokhe
フルスクラッチでJSで書かれている可視化ライブラリ。matplotlibをそのまま使うと、Jupyter上では画像が生成されてしまうのが、bokheを使うと拡大縮小等インタラクティブな操作が出来るようになる。客先デモで結構便利に使える。アニメーションとかも作れるけどダルい。
ggplot
Rのggplot2のPython版。pandasのDataFrameとstatsmodelの結果を可視化するのに便利。まだこなれてない感あるので、当面はseaborn使っとけという感がある。
plotly
pythonからもAPI経由で使えるクラウドベースの可視化ツール。PandasとJupyterの連携がある。Web上にグラフとかを公開できる。やたらと高機能で、3Dプロットとかもヌルヌル動く。公開せずにJupyter上で使うだけなら制限なさそうなので今後使っていきたい。(https://plot.ly/python/offline/)
MLPD3
matplotlibのインターフェイスで、そのままD3.jsで可視化してくれる物。Jupyterでこねこねした結果をそのままダッシュボートのWebアプリに載せる場合とかに便利。