以前セットアップを行った時はapt-getが全てに使えて楽に出来たのですが、apt-get install mecab-ipadic
すると
package 'mecab-ipadic' has no installation candidate
と言われてしまい、困ったので少しうろうろしてしまいました。どうやらmecab-ipadic, mecab-ipadic-utf8の両方が現在利用不可能な状態らしく、自分でインストールする必要があるようです。
序に手順を忘れないようにメモしておきます。
###mecabのインストール
# mecab自体はapt-get出来る状態だったので、それを利用します。
$ sudo apt-get install mecab
$ sudo apt-get install libmecab-dev
# ipaの辞書ファイルを落としてきます
$ wget http://mecab.googlecode.com/files/mecab-ipadic-2.7.0-20070801.tar.gz
$ tar zxvf mecab-ipadic-2.7.0-20070801.tar.gz
$ cd mecab-ipadic-2.7.0-20070801/
# carsetにutf-8を指定します
$ sudo ./configure --with-charset=utf8
$ make
# 標準では別の辞書ファイルがインストールされるため、設定を編集してipadicに変更します。
$ sudo vim /etc/mecabrc
# setup時に'dicdir'でなく'dicrc'となっていたのだけどタイポかな…
- dicdir = /var/lib/mecab/dic/debian
+ dicdir = /usr/lib/mecab/dic/ipadic
$ sudo make install
これでmecab自体は利用可能な状態になります。terminal上でmecab
を実行し、適応な日本語を入力するとパースしてくれます。
###mecab-rubyをインストール
毎回この作業をやるたびに「なんでgem install出来るようになってないんだろう…」と思うわけですが、まぁ。
# mecab-rubyは利用するmecabのバージョンを確認し、それに合わせたバージョンを利用するのが良いみたいです。
#今回のapt-getでは0.98がインストールされたので、それに合わせます。
$ wget http://mecab.googlecode.com/files/mecab-ruby-0.98.tar.gz
$ tar zxvf mecab-ruby-0.98.tar.gz
$ cd mecab-ruby-0.98/
# gemspecのバージョンが間違っていて気持ち悪いので直します。
$ vim mecab-ruby.gemspec
- s.version = '0.97'
+ s.version = '0.98'
$ gem build mecab-ruby.gemspec
$ gem install mecab-ruby-0.98.gem
これでrubyから利用可能になりました!後はGemfileに'mecab-ruby'とでも記述してNokogiriでパースしたコンテンツを形態素解析しようがTwitterのストリームを解析しようがご自由に!Yay!
####うろうろしたURL
バージョン違いのmecab-rubyを共存させる with Homebrew
mecabのインストールについて
Linux Mint - Ruby で形態素解析 MeCab を使う!
MeCab: Yet Another Japanese Dependency Structure Analyzer
Ubuntuで環境構築のメモAdd Star
Ubuntu 10.04にMeCabをインストールAdd Star
MeCab: Yet Another Part-of-Speech and Morphological Analyzer