# mecabをpythonスクリプトから使う
※ Amazon-Linux CentOS7 をお使いの皆様へ 2016年1月現在、EC2(Centos7系) yum で mecab と mecab-python をエラーなしでいれる最速パターンです
- (sudo yum install python python-pip ) ※すでにあると思われるのでry
sudo rpm -ivh http://packages.groonga.org/centos/groonga-release-1.1.0-> 1.noarch.rpm
sudo yum install mecab mecab-devel mecab-ipadic -y
sudo pip install https://mecab.googlecode.com/files/mecab-python-0.996.tar.gz
# coding: utf-8
import MeCab
m = MeCab.Tagger ("-Ochasen")
print m.parse ("ご機嫌はいかがでしょうか")
python mecab.py
結果:
ご ゴ ご 接頭詞-名詞接続 機嫌 キゲン 機嫌 名詞-一般 は ハ は 助詞-係助詞 いかが イカガ いかが 名詞-形容動詞語幹 でしょ デショ です 助動詞 特殊・デス 未然形 う ウ う 助動詞 不変化型 基本形 か カ か 助詞-副助詞/並立助詞/終助詞 EOS
以上。
-
mecab-devel がないと、pip install mecab で mecab-configないってエラーがでる。
-
mecab-ipadic は辞書ファイル。gccのコンパイルエラーとかmake とかヤダん、yum だけって人は黙って3つともいれとく。