#seabornとは
Pythonのグラフ描画のためのライブラリです。。最も有名なライブラであるmatplotlibのラッパー関数(内包プログラム)という位置づけ。簡単に見た目綺麗なグラフの描画が出来る他、一括での処理などの機能もある程度充実しています。細かく指定して描画するならmatplotlib、簡単に綺麗にならseabornのです。
#準備
まずは、pipでseaborn
のライブラリをインストールして下さい。pip?って方はこちら。
ライブラリをインポートします。seaborn
にsns
という名前をつけてimport
します。
import seaborn as sns
サンプルはタイタニックのデータで試してみます。タイタニックがわからない人は「kaggle タイタニック」で調べて下さい。
pandasでデータフレームを作ります。
dataframe = pd.read_csv('train.csv')
##データ件数集計(Countplot)
最も基本的なデータの件数の集計可視化です。これにはCountplot
を使います。基本的にはY軸は件数なので、X軸のみを指定します。
例として、Pclass(部屋の等級)と件数の関係を描画します。X軸x
にPclass
、元データdata
にdataframe
を指定します。
sns.countplot(x="Pclass", data=dataframe)
sns.countplot(y="Pclass", data=dataframe)
系列を追加する場合はhue
を追加します。(例としてhue
にSex(性別)を追加します。)
sns.countplot(y="Pclass", data=dataframe, hue='Sex')
その他にも軸の中の順序や色の変更は可能なので、興味があれば調べてみて下さい。
また、ラベルの変更などは、元ラッパー元であるmatplotlibを修正すれば可能ですが、複雑なので省略します。
Countplot
だとメリットは感じにくいかもしれません。他のdistplot
pairplot
jointplot
等の方がメリットを感じられると思います。
#最後に
初心者にもわかるように、Pythonで機械学習を実施する際の必要な知識を簡便に記事としてまとめております。
目次はこちらになりますので、他の記事も参考にして頂けると幸いです。