85
81

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 5 years have passed since last update.

MacにMecabをインストールする (2013.3)

Last updated at Posted at 2013-03-09

この記事は、zariganitoshさんの記事を基に、実際に私が試した内容をまとめただけのものです。

MeCabとは

オープンソースの日本語の形態素解析エンジンです。
日本語の文章を分析して、名詞を取り出してくれたりするすごいやつです。

MeCabとsaykana組み合わせて使えば、漢字混じりの日本語を喋らせる事が出来るようになります。
さらに、Node.jsでTwitterライムラインを監視し、更新された内容をMeCabで解析→sayknaで出力させて、日本語のツイートを喋らせる事もできます。

前提条件

ダウンロード

MeCabとIPA辞書を上のリンクからダウンロードして、適当なディレクトリにおきます。
以降は~/Downloadsにダウンロードした前提で書きます。

インストール

MeCab のインストール

まずは、MeCabをインストールします。

コンソール
cd ~/Downloads
tar zxfv mecab-0.996.tar.gz
cd mecab-0.996
./configure
make
make check

チェックで何もエラー、警告が出ていなければインストールします。
私の環境では特にエラーはありませんでした。

コンソール
sudo make install

IPA辞書のインストール

次に、IPA辞書をインストールします。
IPA辞書が無いと、MeCabを実行したときに「辞書が無いです」エラーが発生します。

コンソール
cd ~/Downloads
tar zxfv mecab-ipadic-2.7.0-20070801.tar.gz
cd mecab-ipadic-2.7.0-20070801
./configure --with-charset=utf8
make
sudo make install

実はここで嵌ったのが、インストールは出来たけど、MeCabでちゃんと解析できなかったという現象です。
しかし、参考にしたサイトさんの追記で、文字コードを指定してやれば良いということが分かり、無事動作させることが出来ました。
IPA辞書のデフォルトの文字コードがEUCだったらしいです。

これでインストールは完了です。

動作確認

形態素解析でお決まりの文句が、ちゃんと解析されるか試してみましょう。

コンソール
mecab
すもももももももものうち

以下のように出力されるはずです。

コンソール
すもも	名詞,一般,*,*,*,*,すもも,スモモ,スモモ
も	助詞,係助詞,*,*,*,*,も,モ,モ
もも	名詞,一般,*,*,*,*,もも,モモ,モモ
も	助詞,係助詞,*,*,*,*,も,モ,モ
もも	名詞,一般,*,*,*,*,もも,モモ,モモ
の	助詞,連体化,*,*,*,*,の,ノ,ノ
うち	名詞,非自立,副詞可能,*,*,*,うち,ウチ,ウチ
EOS

最後の”うち”が名詞になっているのはご愛嬌といった所でしょうか(^^;)
コマンドの詳細は、mecab -hか、MeCab (和布蕪) ※公式?を参照してください。

アンインストール

エラーが発生したり、もう使わないよーとなった時はアンインストールします。

先にIPA辞書をアンインストール。

コンソール
cd ~/Downloads
cd mecab-ipadic-2.7.0-20070801
sudo make uninstall

次に、MeCabをアンインストール。

コンソール
cd ~/Downloads
cd mecab-0.996
sudo make uninstall

再度ビルドする

IPA辞書の./configureにオプションを指定しなくて失敗しました。
そこで再度ビルドしようとした時に、クリーンしないとビルドに失敗したので、一応手順をのせます。

コンソール
cd ~/Downloads
cd mecab-ipadic-2.7.0-20070801
make clean

クリーンしたあとで、インストールの./configure .....以降の手順を踏みます。

参考にしたサイト

  1. ベイジアンフィルターで日本語を分類する。 by zariganitosh
  2. saykanjiコマンドを定義して漢字仮名混じり文を読み上げる by zariganitosh

おまけ(saykana関連)

おまけ(Twitterボット関連)

  1. OpenJTalk を使って Node.js で音声合成するモジュール作った by hecomi
  2. 20 行で作る node.js による Twitter bot 作成講座 by hecomi

以上

85
81
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
85
81

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?