LoginSignup
5
11

More than 5 years have passed since last update.

Pythonを使った分析をやる上で必要なこと

Last updated at Posted at 2018-11-12

はじめに

これから分析をやりたい人向けに情報をまとめます。

目標:分析の仕事が出来ること

  • Pythonを使った分析
  • 回帰分析などの手法の理解・使用

その他目標

  • PythonらしいPythonの書き方を習得する
  • Python環境構築

分析をやる上で勉強してほしい&必要なこと

環境

Pythonで分析を行う場合、多くの標準出ないパッケージを扱うことになります。その場合、依存関係やバージョン管理がかなりネックになってきます。(最近流行りの機械学習周りも同様です)

そこで、分析や機械学習に特化したPython環境を用意しているので、有名なのがanacondaです。

しかし、環境を汚したくないかたや、GPUマシンとラップトップのマシンで環境を同等にしたい方もいらっしゃると思います。
そんな時は、Dockerで環境を構築することをお勧めします!

Pythonライブラリ

pythonでグラフ描画を行うライブラリにはこのようなものがあります

pandasを使うことで、データの読み込みや統計量の表示、が簡単にできるようになります。また、主要な部分がC言語やCythonで書かれているので非常に高速に処理を行うことができます。

numpyは配列(リスト)計算を高速にするライブラリです。numpyを使うことで配列を扱いやすくなり、コードがシンプルになります。

matplotlibはpythonでグラフを描画するときに使われる標準的なライブラリです。簡単なアニメーションを作ることも可能です。

また、pythoを使った統計ではNaNの処理が重要です。

統計の知識

分析では主に回帰分析と基礎分析が重要です。

回帰分析
基礎分析

その他必要なこと

調べる力

分析に限った話ではありませんが、調べる力はとても重要です。

データベース(SQL)

分析ではデータベースを操作することが多いです。SQLでのデータベースの操作に慣れておきましょう。

スクレイピング

webサイトから情報を取得する際必要になります。

5
11
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
5
11