0
3

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 5 years have passed since last update.

サルでもわかる統計学-君の友達の意見は、果たして実証できる?-

Last updated at Posted at 2019-06-27

はじめに

もはやプログラミングでもなんでもないが、僕が市場調査やデータ分析をこれまで行ってきたにあたり、色々と共有できる知識や、書き置き程度に誰かの参考になるんじゃないかとふと思ったので、市場調査や統計学的な観点から、「君の友達の意見は、果たして実証できるか(信ぴょう性があるか)」ということをつらつらと書いてみたいと思う。 途中から式がいきなり出てきたり、小難しい統計用語を使ってわかりにくい説明文にしないよう、極力統計的に、ただし日常的な話題を扱う形で書いてみたい。

「私、年収1,000万以下の男は無理」

昨今、未婚の時代とも言われるくらい生涯未婚率が上がっていると聞く。 現実問題、2019年の未婚率は中々下がっているようだし、まぁ時代的な背景を考えると結婚というシステムが色々と破綻してるんじゃないか的な意見もあるかもしれないので、そこらへんは特に触れないで割愛しておく。 まぁともかく、この見出しのようなことを言う人がどのくらいいるのかは定かではないが、近年の平均年収は「432万円」という情報を見ると、2倍以上の開きがある。しかもおよそ労働人口を20代~60代として平均を算出したものだとするなら、全年齢で見てもこのくらいに落ち着いてしまうという話だ。日本の公式発表なのだからまぁ本当だと信じたい。日本政府はうそつきの集まりだからな ともかく、そんな実態とかけ離れた年収を結婚の足切り条件にするならば、彼女たちはどこらへんを狙っていかなければいけないのか。それを少し見てみよう。

労働人口の4.2%程度を見つけてみろ

さて、年収1,000万円以上の稼ぎがあるという人たちは、実際どのくらいいるのだろうか? このサイトによると、日本の給与所得者数4869万人を母数としたとき、平成28年度(2016年)時点で4.2%、つまり228万人くらいだという。 意外と多いなぁという感想をお持ちかもしれない。横浜市の人口372万人よりは少ないが、川崎市の人口147万人よりは全然多い。これだけ日本にいるのなら、なんとか狙えるんじゃないか?と思ってしまうかもしれないが、パーセンテージで見るのがミソだ。なぜなら、ダンバー係数という、人一人当たりが友達になれる数は150人と決まっているので、228万人という数はまったく現実的ではないから。 もっと言えば、このサイトによると、たまに連絡する人の数ですら50人を超えないのだから、1,000万円稼いでて、更に親しくなって…という数になると、ますます希望は遠のく。

ちなみにパーセント、とよく言うが、パーセントってそもそもなんなの?という方がもしいたら、念のため解説しておく。
パーセントとは、percentと表記し、100を母数にした場合、その中にどのくらい含まれるか、ということを示す数学記号である。つまり、100%というのを全体とした場合、N%というのは「100のうちN個存在する」ということだ。
今回の例で言うと、4.2%というのは「100人いたとしたら、4.2人が当てはまる」ということになる。
4.2人というのは現実的ではないので、4人としよう。100人いたらたった4人だけがいわゆる1千万プレーヤーということになる。
もっとわかりやすくするために、これを大体学校のクラスの人数くらいに換算すると、1クラス30人くらいとしたら、クラスに大体1人いるかなくらいの計算となる。さらに注意すべきは、この給与所得者は全年齢層や性別をその割合に含んでいるため、その平均となる。
別のサイトで見てみると、男性で6.7%くらいらしいが、それでも4人→6人ちょっとと、2~3人増えたに過ぎないし、この男性陣が20代~30代前半であるという保証はどこにもない。20代、30代で年収1千万は割合的に1%もないくらいっぽい(このサイトでの計算が正しければね)
つまり、100人中1人いるかどうかであり、1,000人探してようやく1人いるかな、くらいの割合である。
1,000人って大企業の従業員の人数レベルだぜ?
中小企業の50人くらいの会社を20社くらい集めて、くまなく探しているかなーくらいのレベルである。
まぁ、とはいえ東京や大阪みたいな大都市であれば有数の大企業もあるし、そこで働く超エリートの人たちもいるわけだから、もう少しターゲティングしながら探せば見つからないこともなさそうだが、問題はその人が果たして君を好きになってくれるかということである。
1,000人中1人しかいない人を見つけて、更にその人が自分のことを好きになってくれる確率は、果たしてどのくらいだろうね、って話。

じゃあ統計的に考えてそれってどうなの

先ほどの話で、労働人口に対して大体4.2%、男性に絞れば大体6.7%だったということがわかり、更に20~30代では1%行くか行かないかくらいだということがわかった。 その数字が何を意味するのか、ということを考えていくのが統計学の役割だ。 基本的に数字というのは何かと比較してこそ、実証する意味があるものだ。つまり、一つのデータでN%だったから有効かそうじゃないかを考えるのは、結構意味がない行為と言える。 世に存在するあらゆる数字と比較してこそ、統計的にその数値は意味がありますね、ということが言えるので、ちょっといろんな数値と比較してみよう。 色んな数値をまとめることで有名なガベージサイト曰く、例えば正社員の割合を見てみると男性で約78%、女性で44.2%らしい。これも各年代を含んでの数値なので、新卒や働き盛りの20~30代だけで見ると、まぁ男性は8割~9割は正社員ですね、女性はもうちょっと少なくて5割~6割くらいですね、って感じ。 だから、男性の78%くらいは正社員で働けてるけど、そのうち1千万稼いでるのはそのうちわずか6.7%くらいかな?という比較ができる。そう、やはりかなり少ないということが分かる。 平均というのはいろんな高いもの、低いものをおしなべて計算したものなので、時として「平均は高い、もしくは低い数値にひっぱられるから、最頻値がいいよ」という人がいるかもしれない。 最頻値とは、全データの中で最も登場するのが多い数値のことを指す。 つまり、普通に街中を歩いてたら一番出くわすであろう数値の領域ってこと。 そういう見方ももちろんあるので、ニュースやサイトなどで「平均〇〇は××円」と書かれていても、実は鵜呑みにしないほうが良い。なんでかって、そのデータの中にはいわゆる「ヤバいやつ」がいて、平均の数に影響を与えてるかもしれないからだ。 その辺については、また今度触れてみようと思う。

友達の意見は疑ってかかろう

以上のことから、ふとした友達の発言や彼氏彼女の発言をまるっきり信じるということはおすすめできないということがわかっただろう。何となく肌感覚で「そんなやついねーよ」とか「それってかなりレアケースじゃないの?」と思ったら、まずは発表されてる数値や周りのサンプル(人たち)に色々聞いてみて、それが本当かどうかを調べる。これが統計学の本来のあり方だし、正しい使い方ともいえる。 ただし、「年収1千万以上の男がいい」と言っている女性は、そもそも労働市場においてその男性がどれほどの価値を持っているか図ることができるか怪しい頭脳の持ち主なので、「伝説のポケモンつかまえたい」と言っているのと同じくらいレアケースな話をしてるんだな、と思うくらいでちょうどよいかもしれない。 何にせよ、あなたの家族や友達が「〇〇ちゃんなんて今回のテストは〇〇点だったのよ!」とか、「××ってやつの年収は△△万円らしいぜ!」と言ってきたら、まずはその割合がどのくらいいたのか考えるくせを身に着けると、少しは気が楽になるかもしれない。
0
3
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
3

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?