Posted at

散布図行列


散布図行列

「スポーツテストデータ」を例に説明します。

# データフレーム操作に関するライブラリをインポートする

import pandas as pd
from pandas.tools import plotting # 高度なプロットを行うツールのインポート

# 「#」(シャープ)以降の文字はプログラムに影響しません。

# 図やグラフを図示するためのライブラリをインポートする。
import matplotlib.pyplot as plt
import matplotlib.ticker as ticker
%matplotlib inline

# URL によるリソースへのアクセスを提供するライブラリをインポートする。

# import urllib # Python 2 の場合
import urllib.request # Python 3 の場合

# ウェブ上のリソースを指定する

url = 'https://raw.githubusercontent.com/maskot1977/ipython_notebook/master/toydata/sports_dataJt.txt'
# 指定したURLからリソースをダウンロードし、名前をつける。
# urllib.urlretrieve(url, 'sports_dataJt.txt') # Python 2 の場合
urllib.request.urlretrieve(url, 'sports_dataJt.txt') # Python 3 の場合

# データの読み込み

df = pd.read_csv('sports_dataJt.txt', sep='\t', index_col=0)

df

df.columns[4:14]

# 散布図行列(左側の4列だけ)

plotting.scatter_matrix(df.dropna(axis=1)[df.columns[0:4]], figsize=(8, 8))
plt.show()

# 散布図行列

plotting.scatter_matrix(df.dropna(axis=1)[df.columns[:]], figsize=(20, 20))
plt.show()