#とりあえずPythonをMeCabと連携させてみたい!
まずは参考にさせていただいたのはこちらPython + mecab をyum のみで入れる、3つのステップ
3ステップ目がうまくいかなかったので調べてみました。
ひとまずPythonは入っているとします。3ステップ目のみ変更してみました。
##まとめ
rpm -ivh http://packages.groonga.org/centos/groonga-release-1.1.0-> 1.noarch.rpm
yum install mecab mecab-devel mecab-ipadic
pip install mecab-python3
上記3つのコマンドを実行するとPythonからMecabが利用できました。管理者権限がない場合はそれぞれ「sudo」を前につけてあげてください。
##リポジトリの設定
最初に
rpm -ivh http://packages.groonga.org/centos/groonga-release-1.1.0-> 1.noarch.rpm
を実行します。リポジトリが追加されます。
##Mecabのインストール
2番目のyumを使ってmecabをインストールします。
yum install mecab mecab-devel mecab-ipadic
を実行すると和布蕪がインストールされコマンド上で利用できるようになります。
mecab をコマンド実行し、次の行で何か日本語を入力します。
そうすると解析結果が表示されます。今回は試しに「今日はたくさん雪が降っている」と入力してみました。mecab実行中は何度でも入力できますが、動作確認後「CTRL+C」で一旦コマンドを終了します。
# mecab
今日はたくさん雪が降っている。
こん 名詞,固有名詞,人名,名,*,*,こん,コン,コン
?? 名詞,一般,*,*,*,*,*
?? 記号,一般,*,*,*,*,*
日 名詞,一般,*,*,*,*,日,ヒ,ヒ
は 助詞,係助詞,*,*,*,*,は,ハ,ワ
たくさん 名詞,副詞可能,*,*,*,*,たくさん,タクサン,タクサン
雪 名詞,一般,*,*,*,*,雪,ユキ,ユキ
が 助詞,格助詞,一般,*,*,*,が,ガ,ガ
降っ 動詞,自立,*,*,五段・ラ行,連用タ接続,降る,フッ,フッ
て 助詞,接続助詞,*,*,*,*,て,テ,テ
いる 動詞,非自立,*,*,一段,基本形,いる,イル,イル
。 記号,句点,*,*,*,*,。,。,。
EOS
^C
##Pythonからの利用
次にPythonから利用できるようにします。
参考サイトの3番目で
pip install http://mecab.googlecode.com/files/mecab-python-0.996.tar.gz
とありますがこちらを実行すると
HTTP error 404 ....
とエラーが発生しました。GoogleCodeは2016年1月25日で閉鎖されたようです。それで、mecab-python3をインストールします。
pip install mecab-python3
とすると無事インストールできました。
##サンプル実行
よくあるサンプルを実行してみます。
# coding: utf-8
import MeCab
n = MeCab.Tagger()
print( n.parse("今日もあれしないとね") )
そしてコマンドラインから
# python mecab.py
と実行すると
今日 名詞,副詞可能,*,*,*,*,今日,キョウ,キョー
も 助詞,係助詞,*,*,*,*,も,モ,モ
あれ 動詞,自立,*,*,一段,連用形,あれる,アレ,アレ
し 動詞,自立,*,*,サ変・スル,未然形,する,シ,シ
ない 助動詞,*,*,*,特殊・ナイ,基本形,ない,ナイ,ナイ
と 助詞,接続助詞,*,*,*,*,と,ト,ト
ね 助詞,終助詞,*,*,*,*,ね,ネ,ネ
EOS
と無事表示されPythonからMecabが利用できました。さて何しようかな。