Pandasとは
PandasとはPythonのもつデータ解析のためのライブラリのことである。
Python自体でビッグデータの統計やグラフ処理はfor文を用いて膨大な計算回数を行わなければならないが、このPandasというライブラリを使うことで高速処理を行うことが可能になる。
Pandasはオープンソースであり、誰でも無料で利用することができる。ソースコードは主にC言語が使われており、それによって高速処理が可能になっている。
データの分析は前処理の難易度が高いとされているので、それを簡易的に行えるPandasはまさに必須のライブラリといえる。
Pandasを利用するには、Anacondaを使ってPythonなどとまとめてダウンロードするのが簡単でいいだろう。
Anaconda: https://www.anaconda.com