いきさつ
これに大学のゼミから有志メンバー(6名)で参加する事になりました。
取り組むテーマは「ID付POSデータの分析」です。
私たちは経営学部所属でエンジニアではありません(私もフロントエンドしか知りません)。しかしビッグデータ分析に興味があります。そして、**「(何がどう良いのか知らないが流行っているらしいので)Pythonを勉強したい!」**というメンバーが多く、Pythonを使ってデータ分析の学習を始めることにしました。
そこでまずは学習環境を整えるため色々と調査しましたが、これは**「私たちのような文系の人間にPythonを教える側の人」に有益な情報かも**と思って、私たちの学習環境をまとめてみました。
学習環境構築
- チームで学習するためのツール
- 統計学を学習するためのツール
- Pythonのインストール
1. チームで学習するためのツール
HackMD
https://hackmd.io/
- メモ、ノートアプリ
- webアプリ(無料)
- ログイン(サインイン)しなくてもメンバーで同時編集できる
- マークダウンで書ける
- google drive に保存できる
効率良く学習するためにはメンバー全員で知識を共有することが必要だと考えています(経営学部の学生は「効率良く」という事が大好きです)。なんらかのノート共有ツールが必要です。
google document、one note、などもありますが、pythonのコードをメモしようと思うと、マークダウンで書けたほうが簡単にきれいに仕上がります。同時編集するためには、管理者が作ったノートのurlを教えるだけでいいので、私たちでも運用できそうです。
2. 統計学を学習するためのツール
ほとんどのメンバーが、
- エクセルで回帰分析くらいならできる
- エクセルの操作なら出来る
という感じなので、**「エクセルで先に分析手法を学習してから、pythonで同じことをやる」**というのがよさそうだと思いました。
EXCELビジネス統計分析
http://www.shoeisha.co.jp/book/detail/9784798133836
エクセルでクラスター分析などができるアドインがついてくるので、これがいいなと思いました(別の授業の教科書です)。
3. Python
私たちにはPythonをインストールするだけも大変です。ターミナルからとか、pathを通すとか無理です。とりあえず学習段階では、Spyderと有名なライブラリが使えればよさそうです。インストーラー形式で簡単にインストールできるものを使いたいと思います。
Mac win 両対応なのは
- Anaconda
https://www.continuum.io/downloads
windowsのみなら
- python(x,y)
http://python-xy.github.io/downloads.html
まとめ
とりあえずこれで学習を始める準備ができたと思います。
*Pythonの教科書はまだ悩み中です。