#seabornとは
Pythonのグラフ描画のためのライブラリです。。最も有名なライブラであるmatplotlibのラッパー関数(内包プログラム)という位置づけ。簡単に見た目綺麗なグラフの描画が出来る他、一括での処理などの機能もある程度充実しています。細かく指定して描画するならmatplotlib、簡単に綺麗にならseabornのです。
#散布図(jointplot)
今回のテーマは散布図です。散布図作成にはjointplot
を使用します。
seabornの散布図では、散布図と同時にヒストグラムが表示されます。これがデータの把握にも便利ですし、それっぽく見えてなかなか良いです。
#準備
まずは、pipでseaborn
のライブラリをインストールして下さい。pip?って方はこちら。
ライブラリをインポートします。seaborn
にsns
という名前をつけてimport
します。
import seaborn as sns
サンプルはタイタニックのデータで試してみます。タイタニックがわからない人は「kaggle タイタニック」で調べて下さい。
pandasでデータフレームを作ります。
dataframe = pd.read_csv('train.csv')
#基本作成
散布図作成には.jointplot
を使用します。基本的に設定するものは、X軸項目、Y軸項目、元データです。X軸にAge(年齢)、Y軸にFare(運賃)を表示させたグラフを例とします。
図のように、ヒストグラムがついているのがポイントです。
sns.jointplot('Age', 'Fare', data=dataframe)
調べてもらうとわかるのですが、いろいろオプションはあります。
kind
に'hex'
を指定すると、散布図がタイル上になり、オシャレになります。映えるのでお勧めです。
(元データがイマイチのため伝わりにくいですが。)
sns.jointplot('Age', 'Fare', data=dataframe, kind = 'hex')
非常に簡単な構文ですが、詳しくない人にはそれっぽくみえて、やった感がでるのでお勧めです。
#最後に
初心者にもわかるように、Pythonで機械学習を実施する際の必要な知識を簡便に記事としてまとめております。
目次はこちらになりますので、他の記事も参考にして頂けると幸いです。