デシル分析とは,データを10分割して,ランク1とランク10の違いについて把握することに利用できます.
例えば,売上上位の10%と下位10%の店舗ごとの違いを把握できます.
コードはまとめられていないですが,備忘録がてら投稿します.
デシル分析
ライブラリのインポート
library(dplyr)
library()
まず,データを売上が高い順に並び替えます.
# データ選択
desiru = df3
desiru2 =desiru[order(desiru$売上, decreasing=T),]
次にデシルランクを付与します.
desiru2$decile_rank <- cut(desiru2$売上,unique(quantile(desiru2$売上,(0:10)/10,na.rm=TRUE)),label=FALSE,include.lowest=TRUE)
ランクごとの平均を求める
# デシルランク1と10だけ選択
desiru4 = desiru2 %>% dplyr::filter(decile_rank == "1" | decile_rank == "10")
desiru4
デシルランクごとの平均値を求める
desiru2 %>%
dplyr::group_by(decile_rank) %>%
dplyr::summarise_each(dplyr::funs(mean))
desiru4$decile_rank = as.character(desiru4$decile_rank)
ggpairs(desiru4[,c(8,10:13)],aes_string(colour="decile_rank", alpha=0.5))+theme_bw(base_family = "HiraKakuProN-W3")