Pythonデータサイエンス実践講座 第2回
1.はじめに
PyCPAというCPA(公認会計士)向けコミュニティの勉強会に参加させて頂いた後の、自分なりのゆる〜い気付きポイントのまとめです。
Pythonデータサイエンス実践講座 第2回 Powered by PyCPA
実はLT枠(プログラミング学習の遍歴と本講義での目標)で参加したのですが「がんばります!」という勢いだけのLTなので、資料公開は行いません
なお前回同様、今回の内容も講義内容にはほとんど関係ないので、内容が気になる方は、講座で使用している以下の書籍や、この本のベースとなった無料コンテンツを参照してください。
書籍:東京大学のデータサイエンティスト養成講座
無料コンテンツ:GCIデータサイエンティスト育成講座演習コンテンツ 公開ページ
2.ジニ係数って聞いたことあるぞ!
###(1)総合問題3-2
復習のため教科書を読み直してみると、総合問題3-2に、「ローレンツ曲線とジニ計数化」というのがありました。これは東大の無償コンテンツにも含まれているのでそちらを引用します。
ジニ係数・・・昔読んだ本に出てきた「収入の不公平を表す値で0.4越えると暴動リスクがある」っていう「ジニ値」の事っぽい。
不平等の程度を数値で表したものをジニ係数といいます。
この値は、ローレンツ曲線と45度線で囲まれた部分の面積の2倍で定義されていて、0から1の値をとります。値が大きければ大きいほど、不平等の度合いが大きくなります。
総合問題は置いておいて、ジニ係数が気になるのでちょっと調べてみましょう(また何時もの「食い散らかし」にならなければ良いのだが・・・)
###(2)Global Noteデータ
まずは、GDP比較のような公開データ調べる時に使わせていただいているGlobal Noteってサイトで探してみました。Global Noteさんには申し訳ないけど無料で見れるデータだけしか使ってません:p
世界のジニ係数 国別ランキング・推移
日本は0.34。ジニ係数が低いのは安定路線の北欧諸国で、中国・米国・南米など経済成長率が高い国がジニ係数が高い傾向がありそうです。
###(3)OECDデータ
Global Noteには元データ取得先がOECDとだけ記載されているので、OECDデータを調べてそれっぽいのを探してみます。これかなぁ〜。
Income inequality
このサイトとても便利そうです。日本や米国の経年変動はあまり見れませんが、電子国家として急速に社会インフラのIT化が進んだEstoniaは急激にジニ係数が下がっているようです。
###(3)おまけ
ローレンツ曲線とジニ計数化についてはWikipediaをはじめ、いろんなサイトで判りやすい説明がありました。
Wiki ジニ係数
5分でわかるジニ係数
所得格差を測る指標-ジニ係数とローレンツ曲線-
3.総合問題は面白いかも!
総合問題の答えは、東京大学のデータサイエンティスト養成講座のAppendix.2にのっています。Pythonコードの勉強に役立ちそうです(まだやってないけど)
こちらは引用しませんので、各自で頑張りましょう
残念ながら次回2月29日は先約があって参加できないのですが、本シリーズはPyCPAに合わせて書きたいな、と思っています。
Pythonデータサイエンス実践講座 第3回 Powered by PyCPA
第4回に期待します!!