MeCabをインストール
apt-getかaptitudeでインストールする。
sudo aptitude install mecab mecab-ipadic-utf8
mecab
が使えるようになる。
$ mecab
吐き気を催す邪悪とは
吐き気 名詞,一般,*,*,*,*,吐き気,ハキケ,ハキケ
を 助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
催す 動詞,自立,*,*,五段・サ行,基本形,催す,モヨオス,モヨオス
邪悪 名詞,一般,*,*,*,*,邪悪,ジャアク,ジャアク
と 助詞,格助詞,一般,*,*,*,と,ト,ト
は 助詞,係助詞,*,*,*,*,は,ハ,ワ
Rubyバインディングをインストール
libmecab-devも必要らしい。
sudo aptitude install libmecab-dev
バインディングはMeCabとバージョンを合わせたほうがいいらしい。
今回は0.993。
$ mecab -v
mecab of 0.993
ここから選ぶ→ Downloads - mecab - Japanese morphological analyzer - Google Project Hosting
環境に合ったものが見つかったらダウンロードしてRubyGemsにインストール。
wget https://mecab.googlecode.com/files/mecab-ruby-0.993.tar.gz
tar zxvf mecab-ruby-0.993.tar.gz
cd mecab-ruby-0.993/
gem build mecab-ruby.gemspec
gem install mecab-ruby-0.99.gem
インストールが終わったら、ダウンロードしたものは消してOK。
使ってみる
test.rb
require 'MeCab'
m = MeCab::Tagger.new ("-Ochasen")
print m.parse ("ようこそ...『男の世界』へ....")
結果
ようこそ ヨウコソ ようこそ 感動詞
...『 ...『 ...『 名詞-サ変接続
男 オトコ 男 名詞-一般
の ノ の 助詞-連体化
世界 セカイ 世界 名詞-一般
』 』 』 記号-括弧閉
へ ヘ へ 助詞-格助詞-一般
.... .... .... 名詞-サ変接続
EOS
さっきダウンロードしたフォルダに「test.rb」というサンプルも入っているので、そちらも実行してみるとベネ