LoginSignup
9
9

More than 5 years have passed since last update.

Ubuntu 13.10でRubyからMeCabを使えるようにしたメモ

Last updated at Posted at 2014-03-21

MeCabをインストール

apt-getかaptitudeでインストールする。

sudo aptitude install mecab mecab-ipadic-utf8

mecabが使えるようになる。

$ mecab
吐き気を催す邪悪とは
吐き気   名詞,一般,*,*,*,*,吐き気,ハキケ,ハキケ
を 助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
催す  動詞,自立,*,*,五段・サ行,基本形,催す,モヨオス,モヨオス
邪悪  名詞,一般,*,*,*,*,邪悪,ジャアク,ジャアク
と 助詞,格助詞,一般,*,*,*,と,ト,ト
は 助詞,係助詞,*,*,*,*,は,ハ,ワ

Rubyバインディングをインストール

libmecab-devも必要らしい。

sudo aptitude install libmecab-dev

バインディングはMeCabとバージョンを合わせたほうがいいらしい。
今回は0.993。

$ mecab -v
mecab of 0.993

ここから選ぶ→ Downloads - mecab - Japanese morphological analyzer - Google Project Hosting

環境に合ったものが見つかったらダウンロードしてRubyGemsにインストール。


wget https://mecab.googlecode.com/files/mecab-ruby-0.993.tar.gz
tar zxvf mecab-ruby-0.993.tar.gz
cd mecab-ruby-0.993/
gem build mecab-ruby.gemspec
gem install mecab-ruby-0.99.gem

インストールが終わったら、ダウンロードしたものは消してOK。

使ってみる

test.rb
require 'MeCab'

m = MeCab::Tagger.new ("-Ochasen")
print m.parse ("ようこそ...『男の世界』へ....")
結果
ようこそ    ヨウコソ    ようこそ    感動詞       
...『  ...『  ...『  名詞-サ変接続     
男 オトコ   男 名詞-一般       
の ノ の 助詞-連体化        
世界  セカイ   世界  名詞-一般       
』 』 』 記号-括弧閉        
へ ヘ へ 助詞-格助詞-一般     
....    ....    ....    名詞-サ変接続     
EOS

さっきダウンロードしたフォルダに「test.rb」というサンプルも入っているので、そちらも実行してみるとベネ

参考にしたページ

9
9
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
9
9