More than 1 year has passed since last update.

[Python] ライブラリ概観_前処理、計算、ファイリング、可視化

Last updated at 2025-03-06Posted at 2025-03-06

まとめ

データフレーム（表形式データ）の操作を得意とするライブラリ。データの読み込み、クリーニング、変換、統計処理などに優れる。

メリット:
- CSVやExcel、SQLなど多様なデータソースを扱える。
- DataFrame 型で直感的にデータを操作できる。
- 強力なフィルタリング・グループ化・統計処理機能。
デメリット:
- 巨大なデータ（数百万行以上）の処理は遅くなりがち。
- NumPy配列よりもメモリ消費が大きい。

数値計算を高速に行うためのライブラリ。多次元配列 (ndarray) を用いて効率的にデータを扱える。

メリット:
- ndarray はPandasより軽量で、高速に処理できる。
- 多くの科学技術計算ライブラリと相性が良い（SciPy, scikit-learn など）。
デメリット:
- ndarray には行・列のラベルがないため、可読性が低い。
- データの加工やクレンジングにはPandasほどの機能がない。

行列計算や統計処理など、科学技術計算の基礎となるライブラリ。

メリット:
- ベクトル・行列演算を高速に実行できる。
- 科学技術計算のほとんどのライブラリ（SciPy, TensorFlow, PyTorch など）が依存。
デメリット:
- 高度な数値解析機能はSciPyに依存することが多い。

数値計算を目的としたライブラリで、線形代数、統計解析、最適化、信号処理などの機能を提供する。

メリット:
- 最適化 (scipy.optimize)、統計 (scipy.stats)、微分方程式 (scipy.integrate) など、幅広い分野に対応。
- NumPyと組み合わせることで強力な計算環境を構築できる。
デメリット:
- 一部の機能は専門的で学習コストが高い。

数式処理（記号計算）を行うライブラリ。数式の展開・微分・積分などをシンボリックに処理できる。

共通点: NumPy, SciPy, SymPy はどれも数学的な計算を行う。
使い分け:
- 行列演算・ベクトル演算なら NumPy
- 数値解析や線形代数なら SciPy
- 代数的な計算（微分・積分・因数分解）なら SymPy

大規模なデータを効率的に保存・読み書きするためのライブラリ。

データの保存・読み書きに使われる一般的な形式。

Pythonで最も基本的な可視化ライブラリ。折れ線グラフ、棒グラフ、ヒストグラムなどを描画できる。

Matplotlibをベースにした統計的データ可視化ライブラリ。データフレームをそのまま扱える。