R
数学
統計学
データサイエンス

文系卒社会人が統計入門する最短学習法

統計の学習をすると、難しい数式が出てきて躓くことも多々あると思います(経験談)。「入門」とつくタイトルの本であっても、数学当然知っているよ人間が書いていて、全然理解できないことが多いハズ。
筆者もそんな状態から2年間、試行錯誤をしながら学習し、「入門した!」ぐらいは自信を持って言えるようになりました。ただ、入門しただけなので、それより先は未知の分野です。
2年前の自分自身にアドバイスするつもりで、この記事を書きます。
関連する記事は以下のとおりです。

時間と目的別学習方法

統計の裏には数学が密接に関連しています。しかし、数学はどうしても苦手な人もいますし、全ての統計を学習する人が数学のような時間がかかる基礎レベルから理解する必要はないと考えています。特に実務よりも管理を重点に置く方は、基礎的な考え方を理解するだけで十分かと思います。
学習時間の目安は筆者の経験談ですが、当然個人差多いです。学習方法は、文系卒向けなので、理系の方は、圧倒的に短縮できるはず。

短時間速習型

  • ゴール:統計学のエッセンスを掴む
  • 目安となる学習時間:15h
ステップ 学習内容 学習時間目安 コメント
1 統計の実務系 5h まずは、実務面から攻めるのがい位と思います。有名な教材だと「統計学が最強の学問である」あたりです。システム関連の仕事の方は「データサイエンティスト養成読本」のようなムック本もおすすめです。
2 基礎的な統計学 10h 数学苦手でも数理的なエッセンスレベルは理解した方がいいです。私は「まずはこの一冊から 意味がわかる統計学」を使って学習しました。

数学速習型

一気にハードル高くなります。

  • ゴール:数理的な背景の概要を理解した上で統計入門
  • 目安となる学習時間:170h
ステップ 学習内容 学習時間目安 コメント
1 高校数学復習 115h とても時間がかかります・・・。私は「長岡先生の授業が聞ける高校数学の教科書数学」を使いました。削れる項目がないかを探しましたが、全て重要ですね。あえて言うなら図形と計量(正弦定理など)を削ってもいいかもしれません。
※「三角関数を削ってもいいかも」としたのを変更しました
2 大学基礎数学 30h 大学基礎レベルの微分積分は必須です。私は「スバラシク実力がつくと評判の微分積分キャンパス・ゼミ」「スバラシク実力がつくと評判の統計学キャンパス・ゼミ」を使って学習しました
3 統計入門 25h [ようやく統計の世界の入門です。大学基礎数学で数理的な部分を理解できていれば入門できます。「統計学入門 (基礎統計学)」がおすすめです(大学数学を経ずに読むのはお勧めしません)。また、この段階で統計検定2級の勉強もいいと思います

※最初に「短時間速習型」の内容を学習するのもおすすめです。

じっくり型

中長期的に腰を据えないとできません。

  • ゴール:数理的な背景の概要を理解した上で統計入門をし、かつシステムで簡単な統計解析ができる
  • 目安となる学習時間:270h
ステップ 学習内容 学習時間目安 コメント
1 基礎数学 170h 「数学速習型」の内容
2 大学数学演習 80h 微分積分と統計学は演習問題で慣れないと理解が深まらなかったです。私は「スバラシク実力がつくと評判の演習微分積分キャンパス・ゼミ」「スバラシク実力がつくと評判の演習統計学キャンパス・ゼミ」を使って学習しました。
3 ソフトを使った学習 20h 何かアプリケーション使って統計解析をするとより理解が深まります。統計ならR言語が勉強に適してて、「Rによるやさしい統計学」を使って学習しました。

補足

思ったことを羅列していきます。

個人的に感じたコツ

教材のわからない部分は、ドンドン飛ばしていきました。一つのところで躓いていて、時間をかけすぎるよりは、最初に軽く全体を読んで、2度目にもう少し時間をかけるような読み方をしていました。1日ですべてを深く理解することはできないので、少しづつこつこつと積み上げていきます。凡人だからしょうがないね。

学習時間が長すぎない?

正直、長いです・・・。ただ、文系卒の私はこのくらいしないと、統計学の根底にある標準正規分布や微分・積分が理解できませんでした。時間を捻出するために「忙しい人向け睡眠時間を増やさずに睡眠不足を解消した方法」みたいなことを取り組んで捻出しています。また、電車の移動時間などちょっとした隙間時間を使って勉強していました。kindleが持ち運びに最高なので、買ってしまいました。他の電子書籍でもいいと思います。

統計検定2級は役に立つのか?

統計検定2級は、ある程度役に立ちます。特に薄く概要を学習したい場合にいいです。数学をそんなに理解していなくても合格できます。記事「統計検定2級合格までの勉強方法」参照。

R言語ではなくPythonの方がいいのでは?

統計入門という目的に限ればR言語の方が適しているように思えます。環境準備が容易で、バージョンによる差異があまりないので。ただ、Pythonに慣れている方であれば、Pythonでもいいと思います。

時間計測

学習時間を見える化するためにtogglを使っています。スマホ用アプリも使いやすくて重宝しています。昔はExcelで記録してましたが、togglの方が圧倒的にいいです。