LoginSignup
1
2

More than 3 years have passed since last update.

初心者のためのseaborn基礎①データ件数を集計グラフ化(Countplot)

Posted at

seabornとは

Pythonのグラフ描画のためのライブラリです。。最も有名なライブラであるmatplotlibのラッパー関数(内包プログラム)という位置づけ。簡単に見た目綺麗なグラフの描画が出来る他、一括での処理などの機能もある程度充実しています。細かく指定して描画するならmatplotlib、簡単に綺麗にならseabornのです。

準備

まずは、pipでseabornのライブラリをインストールして下さい。pip?って方はこちら

ライブラリをインポートします。seabornsnsという名前をつけてimportします。

import seaborn as sns

サンプルはタイタニックのデータで試してみます。タイタニックがわからない人は「kaggle タイタニック」で調べて下さい。
pandasでデータフレームを作ります。

dataframe = pd.read_csv('train.csv')

データ件数集計(Countplot)

最も基本的なデータの件数の集計可視化です。これにはCountplotを使います。基本的にはY軸は件数なので、X軸のみを指定します。
例として、Pclass(部屋の等級)と件数の関係を描画します。X軸xPclass、元データdatadataframeを指定します。

sns.countplot(x="Pclass", data=dataframe)

image.png
Y軸を指定すると横になります。

sns.countplot(y="Pclass", data=dataframe)

image.png

系列を追加する場合はhueを追加します。(例としてhueにSex(性別)を追加します。)

sns.countplot(y="Pclass", data=dataframe, hue='Sex')

image.png

その他にも軸の中の順序や色の変更は可能なので、興味があれば調べてみて下さい。
また、ラベルの変更などは、元ラッパー元であるmatplotlibを修正すれば可能ですが、複雑なので省略します。
Countplotだとメリットは感じにくいかもしれません。他のdistplot pairplot jointplot等の方がメリットを感じられると思います。

最後に

初心者にもわかるように、Pythonで機械学習を実施する際の必要な知識を簡便に記事としてまとめております。
目次はこちらになりますので、他の記事も参考にして頂けると幸いです。

1
2
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
2