0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

【ざっくり理解】 「Zスコア」をわかりやすく解説

Posted at

この記事では、「Zスコア」について、初心者の方にもわかりやすく説明します。

Zスコアは、データ分析のさまざまな場面、特に異常値(外れ値)の検出などで、実務でも活躍する重要な概念です。ぜひ基礎を押さえて日々の分析で使えるようになりたいですね。それでは始めましょう!

Zスコアとは?

Zスコアとは、あるデータ値が平均値からどれだけ離れているかを、標準偏差の単位で表す指標です。

Zスコアが使われる場面

Zスコアを算出すると、外れ値の識別が容易になります。また、データが標準化されるため、異なる集団・分布に属するデータ同士でも同じ尺度で比較できるようになるというメリットがあります。

この性質は、製造現場でも活用されています。一般に、算出したZスコアが±3の範囲外の場合、そのデータは異常値と判断されることが多いです。これは、正規分布に従うデータでは、約99.7%が±3標準偏差の範囲内に収まるという統計的性質に基づいています。

そのため、部品の寸法や重量などの測定値をZスコアとして評価することで、異常検知や製品品質の管理に役立てることが可能です。

Zスコアの計算方法

Zスコアは以下の式で求めることができます。

Z =  
\frac{X-平均値}{標準偏差}
  • X: 測定したデータ値
  • 平均値: データセットに含まれるデータ全体の平均値
  • 標準偏差: データの平均値からの散らばりを表す指標

Zスコアに変換すると、元のデータの単位(「ミリメートル」「グラム」など)は取り除かれ、データは「平均 0、標準偏差 1」の Z分布(標準正規分布) に対応付けられます。

その結果、どのデータ点が平均から距離があるかを、標準化された尺度によって判断できるようになります。そのため、

  • 複数の学校におけるテストの点数
  • 異なるスポーツの選手成績
  • 製造ラインの部品の長さや重さのデータ

など、異なる種類のデータをモニタリングしたいときに、同じ物差しで比較できるようになります。

JMPでZスコアを算出する

統計ソフトJMP(ジャンプ)を使うと、プログラミングや複雑な数式を知らなくても簡単にZスコアを算出でき、実務でスムーズに分析を行えます。

実際にJMPでZスコアを出してみましょう。今回は3つの方法をご紹介します。

1. 複数の変数をまとめてZスコア化したい場合

1) サンプルデータ「Big Class」(あるクラスの生徒について、氏名・年齢・性別・身長・体重をまとめた架空データ)を開き、メニューから「分析」>「一変量の分布」を選択します。

2) 「身長(インチ)」、「体重(ポンド)」を「Y, 列」に入れて「OK」をクリックすると、ヒストグラムと記述統計量が表示されます。

3) キーボードのCtrlキーを押しながら、「身長(インチ)」横の赤い三角ボタンをクリックし、「保存」>「標準化」を選択します。

※JMPではCtrlキーを押しながらコマンドを選択すると、同じウィンドウ内の同種レポートすべてにコマンドが適用されます。

4) データテーブルに「標準化 身長(インチ)」、「標準化 体重(ポンド)」の列が追加され、Zスコアが確認できます。

2. とりあえず手早くZスコアを確認したい場合

1) データテーブルで「身長(インチ)」列を右クリックし、「計算式列の新規作成」>「分布」>「標準化」を選択します。

2) 標準化 [身長(インチ)] 列がデータテーブルに新たに作成されます。

3. 計算式からZスコアを算出したいとき

1) データテーブル上のメニューから「列」>「列の新規作成」を選択します。
2) 列名に任意の名前を設定します。今回は、身長のZスコアを出すので、「列名」を「標準化[身長(インチ)]」と設定します。
3) 「列プロパティ」のプルダウンから「計算式」を選び、「計算式の編集」をクリックすると、計算式エディタが起動します。

4) 計算式エディタでは、先ほどのZスコアの計算式を次のように組み立てます。

Z =  
\frac{X-平均値}{標準偏差}

a. 「身長(インチ)」をクリック。
b. 上の「-」(引き算)のボタンを押す。
c. 左のコラムの「統計」> 「Col Mean」を選び、「身長(インチ)」を空欄に入れる。
 ※「Col Mean」:指定した列の平均を求めるJMPの関数
d. 計算式の枠外をクリックしてから、上の「÷」(割り算)のボタンを押す。
e. 「統計」>「Col Std Dev」を選び、「身長(インチ)」を空欄に入れる。
 ※「Col Std Dev」:指定した列の標準偏差を求めるJMPの関数

画像7.png
上の計算式が作成されるので「OK」をクリックすると、身長のZスコアがデータテーブルに表示されます。

4. Zスコアから分かること

今回は、あるクラスの生徒の身長・体重をZスコアに変換しました。身長や体重といった生の数値だけでは、健康状態や異常の有無を直感的に判断するのは難しいものです。

しかし、前述のように「算出したZスコアが±3の範囲外であれば異常値と判断されることが多い」という基準で確認すると、すぐに特異な値を持つ生徒がいることに気づけます。

画像9.png

同じ考え方は、製造現場のように数千〜数万の部品を測定するケースにもそのまま応用できます。寸法などの測定値をZスコア化することで、膨大なデータの中から異常値を効率的に検出できることがイメージしやすいでしょう。

まとめ

Zスコアは、単なる統計学の概念に留まらず、「異常値の検出」「ばらつきの見える化」「データの標準化」といった課題を解決する強力な指標で、製造現場や品質管理など実務でも広く活用されています。

統計にそれほど馴染みがなくても、JMPを使えば、直感的にデータの理解や業務の効率化を進めることができます。ぜひトライアル版で今回の内容を試してみてください!

30日間全機能無料!JMPトライアル版(自動課金なし)。
https://www.jmp.com/ja_jp/download-jmp-free-trial.html?utm_campaign=bl&utm_source=blog&utm_medium=JMPblog

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?