Help us understand the problem. What is going on with this article?

MacにMecabをインストールする (2013.3)

More than 5 years have passed since last update.

この記事は、zariganitoshさんの記事を基に、実際に私が試した内容をまとめただけのものです。

MeCabとは

オープンソースの日本語の形態素解析エンジンです。
日本語の文章を分析して、名詞を取り出してくれたりするすごいやつです。

MeCabとsaykana組み合わせて使えば、漢字混じりの日本語を喋らせる事が出来るようになります。
さらに、Node.jsでTwitterライムラインを監視し、更新された内容をMeCabで解析→sayknaで出力させて、日本語のツイートを喋らせる事もできます。

前提条件

ダウンロード

MeCabとIPA辞書を上のリンクからダウンロードして、適当なディレクトリにおきます。
以降は~/Downloadsにダウンロードした前提で書きます。

インストール

MeCab のインストール

まずは、MeCabをインストールします。

コンソール
cd ~/Downloads
tar zxfv mecab-0.996.tar.gz
cd mecab-0.996
./configure
make
make check

チェックで何もエラー、警告が出ていなければインストールします。
私の環境では特にエラーはありませんでした。

コンソール
sudo make install

IPA辞書のインストール

次に、IPA辞書をインストールします。
IPA辞書が無いと、MeCabを実行したときに「辞書が無いです」エラーが発生します。

コンソール
cd ~/Downloads
tar zxfv mecab-ipadic-2.7.0-20070801.tar.gz
cd mecab-ipadic-2.7.0-20070801
./configure --with-charset=utf8
make
sudo make install

実はここで嵌ったのが、インストールは出来たけど、MeCabでちゃんと解析できなかったという現象です。
しかし、参考にしたサイトさんの追記で、文字コードを指定してやれば良いということが分かり、無事動作させることが出来ました。
IPA辞書のデフォルトの文字コードがEUCだったらしいです。

これでインストールは完了です。

動作確認

形態素解析でお決まりの文句が、ちゃんと解析されるか試してみましょう。

コンソール
mecab
すもももももももものうち

以下のように出力されるはずです。

コンソール
すもも   名詞,一般,*,*,*,*,すもも,スモモ,スモモ
も 助詞,係助詞,*,*,*,*,も,モ,モ
もも  名詞,一般,*,*,*,*,もも,モモ,モモ
も 助詞,係助詞,*,*,*,*,も,モ,モ
もも  名詞,一般,*,*,*,*,もも,モモ,モモ
の 助詞,連体化,*,*,*,*,の,ノ,ノ
うち  名詞,非自立,副詞可能,*,*,*,うち,ウチ,ウチ
EOS

最後の”うち”が名詞になっているのはご愛嬌といった所でしょうか(^^;)
コマンドの詳細は、mecab -hか、MeCab (和布蕪) ※公式?を参照してください。

アンインストール

エラーが発生したり、もう使わないよーとなった時はアンインストールします。

先にIPA辞書をアンインストール。

コンソール
cd ~/Downloads
cd mecab-ipadic-2.7.0-20070801
sudo make uninstall

次に、MeCabをアンインストール。

コンソール
cd ~/Downloads
cd mecab-0.996
sudo make uninstall

再度ビルドする

IPA辞書の./configureにオプションを指定しなくて失敗しました。
そこで再度ビルドしようとした時に、クリーンしないとビルドに失敗したので、一応手順をのせます。

コンソール
cd ~/Downloads
cd mecab-ipadic-2.7.0-20070801
make clean

クリーンしたあとで、インストールの./configure .....以降の手順を踏みます。

参考にしたサイト

  1. ベイジアンフィルターで日本語を分類する。 by zariganitosh
  2. saykanjiコマンドを定義して漢字仮名混じり文を読み上げる by zariganitosh

おまけ(saykana関連)

おまけ(Twitterボット関連)

  1. OpenJTalk を使って Node.js で音声合成するモジュール作った by hecomi
  2. 20 行で作る node.js による Twitter bot 作成講座 by hecomi

以上

betahikaru
学生時代はi-mode アプリ(Java) 新入社員時代はLinuxでC言語 今はWindowsでWebアプリ(Java,Javascriptとかもろもろ)
http://betahikaru.com/
Why not register and get more from Qiita?
  1. We will deliver articles that match you
    By following users and tags, you can catch up information on technical fields that you are interested in as a whole
  2. you can read useful information later efficiently
    By "stocking" the articles you like, you can search right away
Comments
No comments
Sign up for free and join this conversation.
If you already have a Qiita account
Why do not you register as a user and use Qiita more conveniently?
You need to log in to use this function. Qiita can be used more conveniently after logging in.
You seem to be reading articles frequently this month. Qiita can be used more conveniently after logging in.
  1. We will deliver articles that match you
    By following users and tags, you can catch up information on technical fields that you are interested in as a whole
  2. you can read useful information later efficiently
    By "stocking" the articles you like, you can search right away
ユーザーは見つかりませんでした