Help us understand the problem. What is going on with this article?

Ubuntu 13.10でRubyからMeCabを使えるようにしたメモ

More than 5 years have passed since last update.

MeCabをインストール

apt-getかaptitudeでインストールする。

sudo aptitude install mecab mecab-ipadic-utf8

mecabが使えるようになる。

$ mecab
吐き気を催す邪悪とは
吐き気   名詞,一般,*,*,*,*,吐き気,ハキケ,ハキケ
を 助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
催す  動詞,自立,*,*,五段・サ行,基本形,催す,モヨオス,モヨオス
邪悪  名詞,一般,*,*,*,*,邪悪,ジャアク,ジャアク
と 助詞,格助詞,一般,*,*,*,と,ト,ト
は 助詞,係助詞,*,*,*,*,は,ハ,ワ

Rubyバインディングをインストール

libmecab-devも必要らしい。

sudo aptitude install libmecab-dev

バインディングはMeCabとバージョンを合わせたほうがいいらしい。
今回は0.993。

$ mecab -v
mecab of 0.993

ここから選ぶ→ Downloads - mecab - Japanese morphological analyzer - Google Project Hosting

環境に合ったものが見つかったらダウンロードしてRubyGemsにインストール。

wget https://mecab.googlecode.com/files/mecab-ruby-0.993.tar.gz
tar zxvf mecab-ruby-0.993.tar.gz
cd mecab-ruby-0.993/
gem build mecab-ruby.gemspec
gem install mecab-ruby-0.99.gem

インストールが終わったら、ダウンロードしたものは消してOK。

使ってみる

test.rb
require 'MeCab'

m = MeCab::Tagger.new ("-Ochasen")
print m.parse ("ようこそ...『男の世界』へ....")
結果
ようこそ    ヨウコソ    ようこそ    感動詞       
...『  ...『  ...『  名詞-サ変接続     
男 オトコ   男 名詞-一般       
の ノ の 助詞-連体化        
世界  セカイ   世界  名詞-一般       
』 』 』 記号-括弧閉        
へ ヘ へ 助詞-格助詞-一般     
....    ....    ....    名詞-サ変接続     
EOS

さっきダウンロードしたフォルダに「test.rb」というサンプルも入っているので、そちらも実行してみるとベネ

参考にしたページ

zakuroishikuro
アイコンお借りしました→http://www.nicotalk.com/ktykroom.html
Why not register and get more from Qiita?
  1. We will deliver articles that match you
    By following users and tags, you can catch up information on technical fields that you are interested in as a whole
  2. you can read useful information later efficiently
    By "stocking" the articles you like, you can search right away