1. rindo

    No comment

    rindo
Changes in body
Source | HTML | Preview
@@ -137,14 +137,10 @@
P(word_k|cat) = \frac{カテゴリ(cat)内での単語(word)の出現回数 + 1}{カテゴリ(cat)に出てきた単語の総数 + 総単語数}
```
となります。
-機械学習初心者がナイーブベイズに手を出してみる (2) - 実装編
-
-で実装したいと思います。
-
#### <対数をとる>
サンプルデータでは、大したことないですが実際の計算に当てはめてみると `P(word|cat)`の分母が非常に大きくなってしまうことがあります。
理由は、 単語数が非常に多くなる可能性があるからです。そのようなときにアンダーフローを起こしてしまう可能性があります。
@@ -169,10 +165,16 @@
\log P(cat) + \prod_{i=0}^k \log P(word_k|cat)
```
参考 : [対数(LOG)の計算と公式!これでもうバッチリ!!](http://kenyu.red/archives/3132.html)
+### <次回>
+
+[機械学習初心者がナイーブベイズに手を出してみる (2) - 実装編](http://qiita.com/RINDO/items/8caef9daba5f10caebbe)
+
+で、Pythonを使って実装したいと思います。 (サイト参考にして)
+
#### 参考
以下のサイトを非常に参考にさせていただきました。ありがとうございました。
* [ナイーブベイズを用いたテキスト分類](http://aidiary.hatenablog.com/entry/20100613/1276389337)