[グラフビルダーで描いたパラレルプロット。線の滑らかさは自由に調整できます。]
※今回の内容はYouTube動画でもご紹介しています。
はじめに
冒頭の美しいグラフをご存じでしょうか?まるでアート作品のようなこのグラフは、「並行座標プロット(パラレルプロット)」と呼ばれています。
今回は、この「並行座標プロット」をテーマに、データ分析初心者の方にもわかりやすく、その内容やJMPによるグラフの作成方法をご紹介していきます。
並行座標プロット(パラレルプロット)とは?
並行座標プロットは、多変量データを可視化するためのグラフの1つです。横に並んだそれぞれの変数の軸上にプロットされたデータを線で結ぶことで、複雑なデータの全体像や変数間の相関を、直感的かつ視覚的に把握するのに役立ちます。
この概要だけでは少しイメージしづらいと思うので、具体例を用いて見ていきましょう。
アヤメの種類を区別してみる
今回は、有名なFisherのアヤメのデータセットを使用します。
このデータセットには、3つの「アヤメの種類」のほか、「がくの長さ」「がくの幅」「花弁の長さ」「花弁の幅」の測定値が、150輪(個体)分収録されています。
これらのデータを分析し、3種類のアヤメ(setosa, versicolor, virginica)を区別する特徴を、統計ソフト「JMP(ジャンプ)」を使って探っていきます。
それでは、さっそくJMPを使って解説を進めましょう。
なお、JMPをお持ちでない方でも、以下のトライアル版を利用すれば、すぐにお試しいただけます。
【30日間無料】JMPの全機能をお試しいただけます(自動課金なし)
トライアル版をダウンロード👉
https://www.jmp.com/ja_jp/download-jmp-free-trial.html?utm_campaign=bl&utm_source=blog&utm_medium=JMPblog
JMPで描く並行座標プロット(パラレルプロット)
JMPを起動し、上の「ヘルプ」から「サンプルデータフォルダ」と進み、「Iris.jmp」を開きます。
「グラフ」から「パラレルプロット」と進み、「がくの長さ」、「がくの幅」、「花弁の長さ」、「花弁の幅」を選択し、「Y, 応答変数」をクリック。「スケールの統一」にもチェックして「OK」を押します。


すると、並行座標プロット(パラレルプロット)が表示されます。
今回はグラフを見やすくするため、データテーブルの各行にあらかじめアヤメの種類ごとに色を割り当てています。グラフの各線の色と種類の対応は以下のとおりです。
• 青:virginica
• 緑:versicolor
• 赤:setosa
青(virginica)と緑(versicolor)は全体的な傾向が似ていますが、青のvirginicaの方が、がくや花弁の長さ・幅の値について緑(versicolor)よりも全般的に大きいことがわかります。
一方、赤のsetosaは、他の2種に比べてがくの幅の値はやや大きいものの、それ以外の値は全般的に小さい傾向があります。
JMPの強み - グラフから一歩踏み込んだデータ探索へ-
通常であれば、このグラフを描いたところで終わることが多いかもしれません。しかし、JMPにはさらに踏み込んでデータを探索できる機能があります。
たとえば、特定の変数の範囲を絞って詳しく分析したい場合は、「ローカルデータフィルタ」という便利な機能を使えます。
では実際に、アヤメのデータで「花弁の長さ」を1.5〜5.0の範囲に絞って調べてみましょう。
「パラレルプロット」横の下向き赤三角ボタンから「ローカルデータフィルタ」を選択します。
次に、「花弁の長さ」を選択し、右上にある「+」ボタンをクリックします。
その後、花弁の長さの範囲を「1.5〜5.0」に指定すると、グラフがそれに連動して、以下のように表示されます。
ここでたとえば、「緑(versicolor)の中で、花弁の長さが最も短い個体を詳しく見てみたい」と思ったとします。
そんなときは、グラフ上でその個体データを選択するだけでOKです。
JMPではグラフとデータテーブルが連動しているため、選択した個体の詳細をすぐにデータテーブルで確認できます。
さらに、同じ範囲で緑(versicolor)のデータだけを取り出して分析したくなったなら、「ローカルデータフィルタ」で「AND」をクリックし、「種類」を選択。それから「versicolor」を選べば、簡単に「花弁の長さ」が1.5-5.0のversicolorのデータを分析できるようになりました。
また、「3種類のアヤメのグラフを別々に並べて検討したい」ときは、「グラフビルダー」を使うのも便利です。
「がくの長さ」から「花弁の幅」までを選択し、「X」にいれます。
そして、右上の「パラレル」のアイコンをクリックすると、並行座標プロット(パラレルプロット)が表示されます。
そして、右上の「段組」に「種類」を入れます。すると3種類のアヤメのグラフが別々に表示されました。
最初にご紹介した方法でも、グラフを個別に表示することはできます。
しかし、グラフビルダーを使えば、箱ひげ図やヒストグラムに切り替えたり、ワンクリックで元のグラフに戻したりできるため、とても便利です。
まとめ
並行座標プロット(パラレルプロット)は、Pythonのmatplotlibなどでも描けますが、事前のデータ処理やコードの準備に手間がかかることが少なくありません。
その点、JMPならグラフを簡単に描けるだけでなく、一部のデータを抽出してフォーカスしたり、他のグラフに切り替えて多角的に分析することが可能です。
こうした対話的な操作によって、より深いインサイトを得られるのもJMPならではの魅力です。
この記事を読んで興味を持たれた方は、ぜひ下記のトライアル版で実際にお試しください。
【30日間無料】JMPの全機能をお試しいただけます(自動課金なし)
トライアル版をダウンロード👉
https://www.jmp.com/ja_jp/download-jmp-free-trial.html?utm_campaign=bl&utm_source=blog&utm_medium=JMPblog