##はじめに
これから分析をやりたい人向けに情報をまとめます。
###目標:分析の仕事が出来ること
- Pythonを使った分析
- 回帰分析などの手法の理解・使用
その他目標
- PythonらしいPythonの書き方を習得する
- Python環境構築
##分析をやる上で勉強してほしい&必要なこと
環境
Pythonで分析を行う場合、多くの標準出ないパッケージを扱うことになります。その場合、依存関係やバージョン管理がかなりネックになってきます。(最近流行りの機械学習周りも同様です)
そこで、分析や機械学習に特化したPython環境を用意しているので、有名なのがanacondaです。
- 科学計算向けPython環境を簡単にインストールできる「Anaconda」入門
- ディストリビューション「Anaconda」とは?
- より効率よく開発できる!AnacondaでPythonの環境を構築する方法
しかし、環境を汚したくないかたや、GPUマシンとラップトップのマシンで環境を同等にしたい方もいらっしゃると思います。
そんな時は、Dockerで環境を構築することをお勧めします!
Pythonライブラリ
pythonでグラフ描画を行うライブラリにはこのようなものがあります
pandasを使うことで、データの読み込みや統計量の表示、が簡単にできるようになります。また、主要な部分がC言語やCythonで書かれているので非常に高速に処理を行うことができます。
numpyは配列(リスト)計算を高速にするライブラリです。numpyを使うことで配列を扱いやすくなり、コードがシンプルになります。
matplotlibはpythonでグラフを描画するときに使われる標準的なライブラリです。簡単なアニメーションを作ることも可能です。
また、pythoを使った統計ではNaNの処理が重要です。
統計の知識
分析では主に回帰分析と基礎分析が重要です。
回帰分析
基礎分析
その他必要なこと
調べる力
分析に限った話ではありませんが、調べる力はとても重要です。
データベース(SQL)
分析ではデータベースを操作することが多いです。SQLでのデータベースの操作に慣れておきましょう。
スクレイピング
webサイトから情報を取得する際必要になります。