この記事では、機械学習でよく使われるパッケージについておさらいしたいと思います。
細かいライブラリーの種類に入る前に、pythonのモジュール(module), パッケージ(package), フレームワーク(framework) の違いを整理したいと思います。
モジュール (module)
モジュールは1つ以上のPython関数、クラス、グローバル変数等を含んだ、.py
の拡張で終わるファイルです。
パッケージ (package)
パッケージは複数のモジュールもしくはパッケージをまとめたダイレクトリーです。CやC++ではライブラリー(Library)とも呼ばれます。
パッケージは必ず _init_.py
という特別なファイルを含みます。
フレームワーク (framework)
フレームワークは複数のパッケージを含んだ、Webアプリケーションの開発の土台となる骨組みです。
Ex. Django, Flask
機械学習で使われるパッケージ一覧
パッケージ名 | 用途 | 参考ドキュメント |
---|---|---|
Pandas | データフレーム処理 | https://pandas.pydata.org/pandas-docs/stable/ |
Numpy | 行列計算 | https://docs.scipy.org/doc/numpy-1.17.0/user/ |
Scipy | 行列計算 | https://docs.scipy.org/doc/scipy/reference/ |
Matplotlib | 描画 | https://matplotlib.org/3.1.1/contents.html |
Seaborn | 描画 | https://seaborn.pydata.org |
NetworkX | グラフ・ネットワーク計算 | https://networkx.github.io |
scikit-learn | 機械学習 | https://scikit-learn.org/stable/ |
TensorFlow | 深層学習 | https://www.tensorflow.org |
PyTorch | 深層学習 | https://pytorch.org |
Keras | 深層学習 | https://keras.io |