2
3

More than 3 years have passed since last update.

箱ひげ図(boxplot)で外れ値を除いて描画する方法

Posted at

pythonで群間の分布を比較する際に箱ひげ図を利用した時の事。
データをそのままカテゴリ毎に箱ひげ図を描画すると・・・

import matplotlib.pyplot as plt
import seaborn as sns
%matplotlib inline

df = load_data() # データの読込

sns.boxplot(df["sim_free_flg"], df["price"])

image.png

外れ値があまりにも大きくて、大事なところが潰れてしまい、比較がしにくい・・・
そんなときに外れ値を除去して表示する方法がないか調べたところ
matplotlibのドキュメントでこんなパラメータを見つけました

image.png


フライヤーポイントのデフォルトシンボルです。空の文字列('')はフライヤーを隠します。Noneの場合、フライヤーのデフォルトは'b+'となります。より詳細な制御は flierprops パラメータで行います。

引数にsym=""を設定すると外れ値を表現しないらしい

sns.boxplot(df["sim_free_flg"], df["price"], sym="")

image.png

簡単にできた!!

2
3
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
2
3