はじめに
データ分析に使用するPythonのライブラリをインストールします。
と言っても"pip3 install ~ "というコマンドを使用すると簡単にできます。
※Python自体の開発環境構築はこちら
今回インストールするライブラリ(これがあれば大体なんでもできるはず)
Numpy ・・・配列同士の演算や多次元配列などの扱いに長けたオブジェクトを提供するライブラリ
Pandas ・・・PythonでデータをRDBっぽい形(データフレーム)で扱うためのライブラリ。
Scipy ・・・科学計算・技術計算のためのライブラリ。特殊関数、最適化、統計処理など
scikit-learn ・・・分類や予測のためのモデルが詰まった機械学習用パッケージ
matplotlib ・・・データビジュアライズツール。簡単に綺麗なグラフが描ける。
①既にインストールしているライブラリの確認
# 既にインストールしているライブラリの確認
$ pip list
※ WARNING: You are using pip version~~~~ というメッセージが表示された場合は
pipをアップデートしましょう。メッセージに記載されているコマンド
(シングルクォート ' で囲われている所)を実行してください。
②データ分析のためのライブラリをインストール
# データ分析で使用するライブラリをまとめて入れる(先ほど確認してなかったものだけでよし)
$ pip3 install numpy pandas scipy scikit-learn matplotlib
#Pythonを使ってライブラリの動作確認(例:Pandas)
$ python3
>>> import pandas as pd
※ ModuleNotfoundError: No module named '_lzma' が出た場合、以下で対応
# Pythonのバージョン確認 $ pyenv versions # インストール済みのパッケージをまとめて再インストールするための前処理 $ pip freeze > latestPackages.txt # Pythonのアンインストール(バージョンは1行目で確認したもの) $ pyenv uninstall 3.7.3 # xzのインストール(エラーの対処) $ brew install xz # Pythonのインストール $ pyenv install 3.7.3 # パッケージの再インストール $ pip install -r latestPackages.txt