Edited at

計画者(programmer)のための横顔(profile)入門 (1)「お金のセンスを測ってみる」on「確率論及統計論」輪講演習

計画者(programmer)のための横顔(profile)入門

表計算ソフトを用いて、確率や統計の手助けを得ながら横顔(profile)を検討する。python やRを用いたり、機械学習、深層学習などを利用するまでには50項目以上になってからを予定している。


伏見康治「確率論及統計論」輪講

https://researchmap.jp/josgkrcbv-2087795/#_2087795

題材が量子力学方面が多く、理解が進まない方がいる。

身の回りの統計、確率に関連する事象をひとつづつ取り上げていく。


第一回

https://100univ.com

「お金のセンスを測ってみる」

というWeb上の質問があった。

性別、年齢、地方、投資経験を答えると、年齢と地方については結果をしめしてもらえた。

この題材を例に、何の横顔に使えるか、使えないかを検討する。

一つの回答で、回答時間を含め、統計量をしめしていることにより、どのように料理可能か検討する。


計画(program)

計画者とは、計画(program)を組む人のことです。

カタカナ語でプログラマと呼ばれていることがあります。

ここでいう計画(program)とは、電子計算機の仕事の内容、順番などを決めることです。

計画には、それまでの統計と確率が役立ちます。

真新しい電子計算機を使う場合には、さまざまな試験をして、統計と確率を計算します。


横顔(profile)

論理科学、物理科学、生命科学、社会科学という確率・分布の異なる分野の科学を扱う場合に、大切な仕組みに横顔(profile)があります。

横顔(profile)は、凹凸があり、出ていることがよいことなのか、ひっこんでいることがよいことなのかは、必ずしも一意に決まらないことを、形を眺めて分析するための道具です。

例えば、ITSSやETSSなどの技能標準(skill standard)に基づいたものです。出ていることがよいことかのように思うことがあるかもしれません。

しかし、横顔にあった仕事を任せるためのものであれば、細かい値よりも形が大事だということがわかります。

その技能も高いだけでは何をまかせればよいかわからず、結局役立ちません。


事例(1)

https://100univ.com

「お金のセンスを測ってみる」

お金.png

何位かは、同じ点(pt:point)であれば、回答時間で順位づけしているらしい。一度100ptだったので、もう一度やってみた結果である。1回目より2割ほど速く、順位も2割ほど高位になっていた。

資料にも「「正答率」と「解答スピード」によってお金のセンス(結果)が異なります。」と書かれている。

全国
60代以上
愛知県

順位
8109
22
166

合計
237904
593
1907

比率
3.408
3.709
8.704

比率は小数点第4桁を切り捨て

この結果が出た時、比率を計算してみると全国と60代以上は1割程度の違いだが、愛知県だと倍以上違うことがわかる。


地域

愛知県はお金のセンスに厳しいかもしれないという仮説を立てることができる。

300位、600位くらいの値があれば、愛知県の横顔として役立てることができるかもしれない。

何かを測ったときに、その測ったものの横顔ではなく、測定した対象の分類の横顔として利用できるかもしれないというのがここでの教訓。

測った結果を分析し、分類を見るとよい。

愛知県の回答率が低くないかを確認するとよい。

全国
名古屋圏
比率

統計
126,706
11,333
8.944

回答
237904
1907(愛知県)
0.801

比率は小数点第4桁を切り捨て

統計:総務省統計局 人口推計(平成29年10月1日現在)全国:年齢(各歳),男女別人口 ・ 都道府県:年齢(5歳階級),男女別人口 p.15

https://www.stat.go.jp/data/jinsui/2017np/pdf/gaiyou4.pdf

回答:「お金のセンスを測ってみる」質問への回答

名古屋圏は、愛知県、岐阜県、三重県の合計である。質問への回答は愛知県。愛知県が名古屋圏の過半数を超える。近似的に用いる。

回答率が一桁違う。

ただし、アンケートに答えている人の割合がどれくらいいるかによる。

ここでは妥当な統計として用いることはできないと判断するかどうかは、アンケートへの回答率から求めたい。アンケートへの回答率は未確認。

倍、半分くらいはよいが、桁が違うものは取り扱いに注意が必要。


年齢

年齢は、ウェブを閲覧する人の年齢構成の資料が何かあれば、比較してみるとよい。

合計
高齢者
比率

統計
126,706
35,152
27.742

回答
237,904
593
0.249

比率は小数点第4桁を切り捨て

統計:総務省統計局 人口推計(平成29年10月1日現在)全国:年齢(各歳),男女別人口 ・ 都道府県:年齢(5歳階級),男女別人口 p.5

https://www.stat.go.jp/data/jinsui/2017np/pdf/gaiyou2.pdf

回答:「お金のセンスを測ってみる」質問への回答

人口推計では高齢者は65歳以上、質問への回答調査では60歳以上。

65歳以上が60歳以上の過半を超えることを想定し、近似的に用いる。

順位は全体と高齢者で1割程度しか変化がない。比率は2桁違うが、必ずしも無効とは言い切れない。

例えば、高齢者であってもウェブを見ている人は、他の年齢層と類似な行動が可能であるという仮説を立てることができるかもしれない。


課題

同じ人が、何度も回答できるようである。

社会的に有意な解析には用いることができないかもしれない。

仮説を立てるための思考実験にはよい。


後日談

データ採りのため、もう一度回答した。13秒。

しかし、前回はたしか17秒。さらに2割くらい速く回答できてしまうため、1位になってしまい、統計データとして役に立たないことになってしまった。

chart.png

chart2.png

何でも測りゃいいっていうものじゃないことの例。教訓。

アンケートは下記4項目

性別

年代

地域

投資経験

年代は、

10代

20代

30代

40代

50代

60代以上

からの選択。

回答してもアンケートに答えていない人の割合が、最初のデータからは推測可能。2回目のデータからは何も計算できない。泣)

こういうアンケートを回答者の視点で利用する場合には、中央値を狙って回答してみて、中央値からのずれを分析するとよい。心理試験などでも応用可能。


参考文献

確率論及統計論(伏見康司)の数式をTeX(LaTeX)入力するための13の技法

https://qiita.com/kaizen_nagoya/items/9c692c4d3546ffbb70b4

追悼 白井諭(自然言語処理)「言語・認識・表現」年次研究会一覧

https://researchmap.jp/jov1bp0k3-45644

平均の近傍が空集合である「ドーナッツ」理論についての白井諭さんの見解を紹介。


著者横顔(author profile)

64歳。

法政大学経済学部経済学科卒業。名古屋工業大学電気工学科卒業。静岡大学大学院理工学研究科博士課程後期設計工学選考。

技術士(情報工学)、工学博士。

確率論及統計論輪講主催者。

別冊経済セミナー「都市と水資源」1985, 著者。

https://www.amazon.co.jp/エントロピー読本-2/dp/4535411077/


文書履歴

ver. 0.10 初稿 20181029 早朝

ver. 0.11 年齢の表を追記 20181029 朝

ver. 0.12 後日談追記 20181029 午前

ver. 0.13 記述構成変更。地域、年代を同じ項目の下に 20181029 昼

ver. 0.14 著者横顔追記 20181029 午後

ver. 0.15 はじめに追記 20181030

ver. 0.16 はてな 付記 20190619

このエントリーをはてなブックマークに追加

https://b.hatena.ne.jp/guide/bbutton