3
11

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 5 years have passed since last update.

データ構造別の可視化手法まとめ

Last updated at Posted at 2019-01-14

はじめに

  • 可視化方法の確立していないデータでは、適切な可視化手法を選択するのは一仕事です。
  • データの可視化方法は伝えたいメッセージやデータの密度等を踏まえて見やすいものを適切に選択する必要がありますが、本稿ではデータの独立変数・目的変数の構造だけから、取りうる可視化手法を列挙してみます。
  • 本稿は自分のメモを兼ねているので適宜加筆予定です。コメントによる補足は大歓迎です。

準備

  • 本稿では何が独立変数で何が目的変数かはっきりしていることとします。
  • 便宜的に各変数を分類的(定性的、カテゴリカル、ラベル)なものと数的(定量的、順序的)なものに分けます。
    • 分類的変数の例:
      • 国名
      • 血液型
      • 論理値(True/False)
    • 数的変数の例:
      • 年齢
      • 時刻
      • 座標

独立変数が1つの場合

(数)→(数)

  • データ例: 気温の時系列
  • 取りうる手法
    • 折れ線グラフ
    • 分布図
    • ヒストグラム(目的変数が頻度の場合)



      画像出典

(数)→(数, 数, ...)

  • 後述の(分類, 数)→(数)と同等に扱える。

(数)→(分類)

  • データ例: 温度による水の相変化
  • 手法
    • 塗り分け図
    • 一次元散布図(確率的関係の場合)



      画像出典

(分類)→(数)

  • データ例: 国別GDP
  • 取りうる手法
    • 棒グラフ
      • 要素を降順に並べ替えることを検討する。
    • 円グラフ、累積棒グラフ(足して1になる場合)
    • レーダーチャート

      image.png

      画像出典

(分類)→(数, 数, ...)

  • データ例: 各生徒各科目の成績
    • 複数のものを複数の評価基準で比較するときなど頻出のパターンですが、グラフが煩雑になりやすく要注意です。
  • 手法
    • レーダーチャート(一枚の図に複数の線)
    • 累積棒グラフ
    • 散布図(目的変数が2次元の場合)
    • ヒートマップ(色または大きさでマトリックス表示)
    • (分類)→(数)の手法(例えば棒グラフ)を複数パネル並べて表示する

      image.png

      画像出典

(分類)→(分類)

  • データ例: 名前と役職のリスト
  • 取りうる手法
    • 表または箇条書き

独立変数が2つの場合

(数, 数)→(数)

(数, 数)→(数, 数)

(数, 数)→(分類)

  • データ例: 温度と圧力による水の相変化
  • 手法
    • 塗分け図
    • 散布図(確率的関係の場合)

      image.png

      画像出典: Pattern Recognition and Machine Learning (C. Bishop)

(分類, 数)→(数)

  • データ例: 男女の年齢別平均年収
  • 手法
    • 折れ線グラフ(複数の折れ線)
    • 散布図(確率的関係の場合)
    • 積み上げ面グラフ



      画像出典

(分類, 数)→(分類)

  • いい例が思いつかないので割愛
  • 手法
    • 散布図
    • (数)→(分類)の手法をタイル化して表示

      image.png

      画像出典

(分類, 分類)→(数)

  • これは(分類)→(数, 数, ...)のパターンを使いまわせます。
    • 例えば (人名, 科目)→(点数) という関係は (人名)→(国語の点数, 数学の点数, ...) という関係と同じ。



画像出典

(分類, 分類)→(分類)

  • データ例: 真理値表
  • 手法
    • 表(マトリックス)

独立変数が3つ以上の場合

  • 基本的に単一の静止画で表現するのは難しくなります。
  • 手法
    • バブルチャート
      • (分類, 数, 数)→(数)の時、独立変数の分類を色で、目的変数を大きさで表現した散布図が使えます。
    • アニメーション(連続量の一つを時刻に変換して、独立変数が2つの時の手法を使う)
    • タイル化(分類別にパネルを分けて、独立変数が2つの時の手法を使う)
    • インタラクティブプロット
      • 例えば、Jupyter notebookではipywidgetsモジュールからスライダやラジオボタンが使えます。
    • 立体視, VRなど



画像出典

その他: 非構造化データの可視化など

参考資料

  1. 疑似カラープロットでもRGB, 色相-彩度-明度などを使うと複数の目的変数がプロット出来そうですが、実際やってみると大変見づらいです。

3
11
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
3
11

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?