#多変量解析とは
多変量解析(英語版)(たへんりょうかいせき、英: multivariate analysis)あるいは多変量統計(英語版)(たへんりょうとうけい、英: multivariate statistics)とは、複数の結果変数からなる多変量データを統計的に扱う手法。主成分分析、因子分析、クラスター分析などがある。一般に、多変量解析を行うためには計算負荷が高く手計算ではきわめて困難だが、コンピュータの発展により、容易に実行できるようになった。
近年では共分散構造分析(「構造方程式モデリング」とも言う)が普及してきている。一方、探索的多変量解析で総称される各種の手法がデータマイニングなどでよく使われるようになっている。
(https://ja.wikipedia.org/wiki/%E5%A4%9A%E5%A4%89%E9%87%8F%E8%A7%A3%E6%9E%90 より引用)
多変量解析とは、ある現象に1つ以上の数値(要因・要素)の大小、有無などが関係しており、そのような数値が結果に対してどのように関わっているのか、もしくはいないのかということを調べ、今後どのような結果になるかを予測しようというもの。
1つ以上の数値(要因・要素)は大きく分けて以下の4つに大別される。
-
名義尺度:
「質」に関わる尺度(要素)でそれぞれ異なる名義尺度同士を比べたり、大小を比較したり出来ない。
加減乗除のいずれも出来ない(しても意味がない)尺度のこと。
(例)性別・人名・職業・名前・電話番号・地域・等 -
順序尺度:
名義尺度と同じく「質」に関わる尺度で、順序にのみ意味があり、尺度同士を比べることは出来ても足したり引いたり出来ない。
(例)「甲・乙・丙」「長男・次男・三男」「暑い・涼しい・寒い」「悪化・変わらず・改善」
足し算や引き算が出来ないのは、例えば「暑い」と「涼しい」の差と、「涼しい」と寒いの差が同じとは限らないため。 -
間隔尺度:
「量」に関わる尺度で、それぞれの間隔に意味がある。「暑い」「涼しい」「寒い」は、上記の通り順にのみ意味があるが、これを「0℃・15℃・30℃」すれば、それぞれの間隔が等しくなり、間隔尺度として取り扱うことになる。
足したり引いたりは出来るが掛けたり割ったりは出来ない。15℃に15℃を足して30℃としたり、30℃から15℃引いて15℃とすることも出来るが、30℃と15℃を比べて、暑さが「2倍になった」とはいえない他にも、偏差値や、IQの数値などがこれに当てはまる。 -
比率尺度:
「量」に関わる尺度で、0にも、それぞれの数値の比率にも意味がある。
加減乗除を行うことが出来る。一般的にいう物理量である。
質量・距離・大きさ・金額等
数学一般でいう「数」の事。
その分類を間違えると多変量解説において後々大きなミスリードを来すので注意が必要。