LoginSignup
1
1

More than 3 years have passed since last update.

Rでデシル分析してみる

Posted at

デシル分析とは,データを10分割して,ランク1とランク10の違いについて把握することに利用できます.

例えば,売上上位の10%と下位10%の店舗ごとの違いを把握できます.
コードはまとめられていないですが,備忘録がてら投稿します.

デシル分析

ライブラリのインポート

library(dplyr)
library()

まず,データを売上が高い順に並び替えます.


#データ選択
desiru = df3
desiru2 =desiru[order(desiru$売上, decreasing=T),] 

次にデシルランクを付与します.

desiru2$decile_rank <- cut(desiru2$売上,unique(quantile(desiru2$売上,(0:10)/10,na.rm=TRUE)),label=FALSE,include.lowest=TRUE)

ランクごとの平均を求める

#デシルランク1と10だけ選択
desiru4 = desiru2 %>% dplyr::filter(decile_rank == "1" | decile_rank == "10")
desiru4

デシルランクごとの平均値を求める


desiru2 %>%
  dplyr::group_by(decile_rank) %>%
  dplyr::summarise_each(dplyr::funs(mean))

desiru4$decile_rank = as.character(desiru4$decile_rank)
ggpairs(desiru4[,c(8,10:13)],aes_string(colour="decile_rank", alpha=0.5))+theme_bw(base_family = "HiraKakuProN-W3")

参考サイト

1
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
1