少し詰まったので、一応メモ。
P.58の3.8.8式で突然、確率の総乗(Π)が出て来たので意味がわかりませんでしたが、どうやらこれはベルヌーイ分布より来ているみたいですね。
f(k;p) = (p^k)*((1-p)^1-k)
とはいうものの、ふつうに考えて、
φ(z)が確率、yが2値(φ(z)>=0.5 y=1、φ(z)<0.5 y=0)なので、単純に確率の積とも解釈できますね。(この時の分布をベルヌーイ分布という)
コインの話で言えば、表が3回連続で出る確率は、(1/3)*(1/3)*(1/3) = 1/27と言うのと同じ話ですね。
参考URL
http://tkengo.github.io/blog/2016/08/22/maximum-likelyhood-estimation-by-machine-learning/
(追記)
3.3.10式
http://gihyo.jp/dev/serial/01/machine-learning/0018?page=2