はじめに
データ分析ライブラリ三種の神器である「Numpy」「Pandas」「Matplotlib」についての入門記事です。ソースコードはこちら
Numpy入門【データ分析ライブラリ三種の神器①】
Pandas入門【データ分析ライブラリ三種の神器②】
Matplotlib入門【データ分析ライブラリ三種の神器③】
NumPyは、Pythonで数値計算を効率的に行うためのライブラリです。この記事では、NumPyの基本的な使い方やデータ処理方法を紹介します。
1. インストールとインポート
NumPyをインストールするには、次のコマンドを実行します。
pip install numpy
2. 配列の作成
NumPyを使用するには、まずnumpy
モジュールをインポートします。慣例として、numpy
をnp
という別名でインポートします。
import numpy as np
2.1 1次元配列
1次元配列は、次のようにnumpy.array
関数にリストを渡すことで作成できます。
arr = np.array([1, 2, 3, 4, 5])
2.2 2次元配列
2次元配列は、リストのリストを渡すことで作成できます。
arr = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
3. 配列の操作
3.1 配列の形状
配列の形状は、shape
属性で取得できます。
arr = np.array([[1, 2, 3], [4, 5, 6]])
arr.shape
-> (2, 3)
3.2 配列のリシェイプ
配列の形状を変更するには、reshape
メソッドを使用します。
arr = np.array([1, 2, 3, 4, 5, 6])
arr.reshape(2, 3)
-> array([[1, 2, 3],
[4, 5, 6]])
4. 数学的演算
4.1 要素ごとの加算
2つの配列を要素ごとに加算するには、+
演算子を使用します。
a = np.array([1, 2, 3])
b = np.array([4, 5, 6])
a + b
-> array([5, 7, 9])
4.2 要素ごとの乗算
2つの配列を要素ごとに乗算するには、*
演算子を使用します。
a = np.array([1, 2, 3])
b = np.array([4, 5, 6])
a * b
-> array([ 4, 10, 18])
5. 統計関数
5.1 平均値
配列の平均値を計算するには、numpy.mean
関数を使用します。
arr = np.array([1, 2, 3, 4, 5])
np.mean(arr)
-> 3.0
5.2 分散
配列の分散を計算するには、numpy.var
関数を使用します。
arr = np.array([1, 2, 3, 4, 5])
np.var(arr)
-> 2.0
6. 線形代数
6.1 行列の積
2つの行列の積を計算するには、numpy.dot
関数を使用します。
a = np.array([[1, 2], [3, 4]])
b = np.array([[5, 6], [7, 8]])
np.dot(a, b)
-> array([[19, 22],
[43, 50]])
6.2 逆行列
行列の逆行列を計算するには、numpy.linalg.inv
関数を使用します。
a = np.array([[1, 2], [3, 4]])
np.linalg.inv(a)
-> array([[-2. , 1. ],
[ 1.5, -0.5]])
7. まとめ
この記事では、NumPyの基本的な使い方とデータ処理方法を紹介しました。NumPyはPythonで数値計算を効率的に行うためのライブラリであり、様々な科学技術計算やデータ解析に応用されています。ぜひ、この記事を参考にNumPyを活用してみてください。
Numpy入門【データ分析ライブラリ三種の神器①】
Pandas入門【データ分析ライブラリ三種の神器②】
Matplotlib入門【データ分析ライブラリ三種の神器③】