mecabをpythonスクリプトから使う
※ Amazon-Linux CentOS7 をお使いの皆様へ 2016年1月現在、EC2(Centos7系) yum で mecab と mecab-python をエラーなしでいれる最速パターンです
- (sudo yum install python python-pip ) ※すでにあると思われるのでry
sudo rpm -ivh http://packages.groonga.org/centos/groonga-release-1.1.0-> 1.noarch.rpm
sudo yum install mecab mecab-devel mecab-ipadic -y
sudo pip install https://mecab.googlecode.com/files/mecab-python-0.996.tar.gz
# coding: utf-8
import MeCab
m = MeCab.Tagger ("-Ochasen")
print m.parse ("ご機嫌はいかがでしょうか")
python mecab.py
結果:
ご ゴ ご 接頭詞-名詞接続
機嫌 キゲン 機嫌 名詞-一般
は ハ は 助詞-係助詞
いかが イカガ いかが 名詞-形容動詞語幹
でしょ デショ です 助動詞 特殊・デス 未然形
う ウ う 助動詞 不変化型 基本形
か カ か 助詞-副助詞/並立助詞/終助詞
EOS
以上。
mecab-devel がないと、pip install mecab で mecab-configないってエラーがでる。
mecab-ipadic は辞書ファイル。gccのコンパイルエラーとかmake とかヤダん、yum だけって人は黙って3つともいれとく。