結論
np.nanmean
を使用する
目的
- 欠損値(NaN)を含むデータの平均を算出する
ライブラリ
項目 | 情報 |
---|---|
matplotlib | 1.22.4 |
np.meanを使用した場合
import numpy as np
data = np.array([2, 4, np.nan, 6])
mean_value = np.mean(data)
# 出力: Mean value using np.mean: nan
print("Mean value using np.mean:", mean_value)
np.meanは、データ内のすべての値(NaNを含む)を考慮して平均を計算します。
しかし、NaNは特殊な値であり、数値計算に直接使用することはできません。
したがって、np.meanがNaNを含むデータを計算しようとすると、結果もNaNになります。
np.nanmeanを使用した場合
import numpy as np
data = np.array([2, 4, np.nan, 6])
nanmean_value = np.nanmean(data)
# 出力: Mean value using np.nanmean: 4.0
print("Mean value using np.nanmean:", nanmean_value)
np.nanmeanは、データ内のNaNを無視して平均を計算します。
つまり、NaNがあっても、その他の数値データに基づいて正しい平均値が算出されます。