はじめに
自然言語処理で近年よく使われているツールとして「MeCab(http://taku910.github.io/mecab/)」が挙げられます。
そのMeCabをMacOSに入れて動作させるところまでの流れを説明します。
今回はMacportsやHOME BREWなどは利用せずやっていきたいと思います。
MeCabをダウンロード
まず、公式サイトの「ダウンロード」から、
MeCab本体とMeCab用の辞書をダウンロードして下さい。
インストール
ダウンロードした、MeCab本体(おそらくmecab-0.996)と、MeCabの辞書(おそらくmecab-ipadic-2.7.0-20070801)をインストールしていきます。
MeCab本体のインストール
まずは、mecab-0.996(MeCabの本体)を解凍し、
ターミナルのcdコマンドでその解凍したフォルダに入ってください。
そして以下のコマンドを順に叩いていきます。
$ ./configure
$ make
$ make check
$ sudo make install
基本的にmake中に出たwarningは無視します。
インストールが終わったら、今度はMeCab用の辞書をインストールします。
MeCab辞書のインストール
まずは、mecab-ipadic-2.7.0-20070801(MeCabの辞書)を解凍し、
ターミナルのcdコマンドでその解凍したフォルダに入ってください。
そして以下のコマンドを順に叩いていきます。
ただし、辞書はデフォルトでは文字コードがEUCでインストールされるので、
扱いやすいようにUTF-8に変更してインストールさせましょう。
$ ./configure --with-charset=utf8
$ make
$ sudo make install
以上でインストールは終了です。
とりあえず使ってみる
$ mecab
すもももももももものうちだけど、そんなことはどうでもいいよね?
すもも 名詞,一般,*,*,*,*,すもも,スモモ,スモモ
も 助詞,係助詞,*,*,*,*,も,モ,モ
もも 名詞,一般,*,*,*,*,もも,モモ,モモ
も 助詞,係助詞,*,*,*,*,も,モ,モ
もも 名詞,一般,*,*,*,*,もも,モモ,モモ
の 助詞,連体化,*,*,*,*,の,ノ,ノ
うち 名詞,非自立,副詞可能,*,*,*,うち,ウチ,ウチ
だ 助動詞,*,*,*,特殊・ダ,基本形,だ,ダ,ダ
けど 助詞,接続助詞,*,*,*,*,けど,ケド,ケド
、 記号,読点,*,*,*,*,、,、,、
そんな 連体詞,*,*,*,*,*,そんな,ソンナ,ソンナ
こと 名詞,非自立,一般,*,*,*,こと,コト,コト
は 助詞,係助詞,*,*,*,*,は,ハ,ワ
どう 副詞,助詞類接続,*,*,*,*,どう,ドウ,ドー
でも 助詞,副助詞,*,*,*,*,でも,デモ,デモ
いい 形容詞,自立,*,*,形容詞・イイ,基本形,いい,イイ,イイ
よ 助詞,終助詞,*,*,*,*,よ,ヨ,ヨ
ね 助詞,終助詞,*,*,*,*,ね,ネ,ネ
? 記号,一般,*,*,*,*,?,?,?