20%は1年生、20%は2年生、60%は3年生とする。それぞれの学年ごとの回答比率は以下。classとfavoritesは独立か?
favorites_by_class = matrix(c(0.3,0.6,0.3,0.6, 0.3, 0.1, 0.1, 0.1, 0.6),nrow=3, dimnames = list(class=c("1年生","2年生","3年生"), favorites=c("アイス","フルーツ","ポテトフライ")))
favorites_by_class
## favorites
## class アイス フルーツ ポテトフライ
## 1年生 0.3 0.6 0.1
## 2年生 0.6 0.3 0.1
## 3年生 0.3 0.1 0.6
apply(favorites_by_class,c("class"), sum)
## 1年生 2年生 3年生
## 1 1 1
同時確率
simultanious_ratio = favorites_by_class * c(0.2,0.2,0.6)
simultanious_ratio
## favorites
## class アイス フルーツ ポテトフライ
## 1年生 0.06 0.12 0.02
## 2年生 0.12 0.06 0.02
## 3年生 0.18 0.06 0.36
sum(simultanious_ratio)
## [1] 1
周辺確率 favorites
favorites = apply(simultanious_ratio, c("favorites"), FUN=sum)
favorites
## アイス フルーツ ポテトフライ
## 0.36 0.24 0.40
周辺確率 class
class = apply(simultanious_ratio, c("class"), FUN=sum)
class
## 1年生 2年生 3年生
## 0.2 0.2 0.6
class %o% favorites
## アイス フルーツ ポテトフライ
## 1年生 0.072 0.048 0.08
## 2年生 0.072 0.048 0.08
## 3年生 0.216 0.144 0.24
p(アイス|1年生)*p(1年生)=0.06だが、p(アイス)*p(1年生) = 0.072なので、favoritesとclassは独立ではない。