1
0

More than 1 year has passed since last update.

【Python】欠損値(NaN)を含むデータの平均を算出する

Posted at

結論

np.nanmeanを使用する

目的

  • 欠損値(NaN)を含むデータの平均を算出する

ライブラリ

項目 情報
matplotlib 1.22.4

np.meanを使用した場合

import numpy as np

data = np.array([2, 4, np.nan, 6])

mean_value = np.mean(data)
# 出力: Mean value using np.mean: nan
print("Mean value using np.mean:", mean_value)  

np.meanは、データ内のすべての値(NaNを含む)を考慮して平均を計算します。
しかし、NaNは特殊な値であり、数値計算に直接使用することはできません。
したがって、np.meanがNaNを含むデータを計算しようとすると、結果もNaNになります。

np.nanmeanを使用した場合

import numpy as np

data = np.array([2, 4, np.nan, 6])

nanmean_value = np.nanmean(data)
# 出力: Mean value using np.nanmean: 4.0
print("Mean value using np.nanmean:", nanmean_value)  

np.nanmeanは、データ内のNaNを無視して平均を計算します。
つまり、NaNがあっても、その他の数値データに基づいて正しい平均値が算出されます。

1
0
1

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
0