mecab
python3
centos7

とりあえずPythonでMeCabを使ってみる

とりあえずPythonをMeCabと連携させてみたい!

まずは参考にさせていただいたのはこちらPython + mecab をyum のみで入れる、3つのステップ
3ステップ目がうまくいかなかったので調べてみました。
ひとまずPythonは入っているとします。3ステップ目のみ変更してみました。

まとめ

rpm -ivh http://packages.groonga.org/centos/groonga-release-1.1.0-> 1.noarch.rpm
yum install mecab mecab-devel mecab-ipadic
pip install mecab-python3

上記3つのコマンドを実行するとPythonからMecabが利用できました。管理者権限がない場合はそれぞれ「sudo」を前につけてあげてください。

リポジトリの設定

最初に

rpm -ivh http://packages.groonga.org/centos/groonga-release-1.1.0-> 1.noarch.rpm

を実行します。リポジトリが追加されます。

Mecabのインストール

2番目のyumを使ってmecabをインストールします。

yum install mecab mecab-devel mecab-ipadic

を実行すると和布蕪がインストールされコマンド上で利用できるようになります。
mecab をコマンド実行し、次の行で何か日本語を入力します。
そうすると解析結果が表示されます。今回は試しに「今日はたくさん雪が降っている」と入力してみました。mecab実行中は何度でも入力できますが、動作確認後「CTRL+C」で一旦コマンドを終了します。

# mecab
 今日はたくさん雪が降っている。
こん  名詞,固有名詞,人名,名,*,*,こん,コン,コン
??  名詞,一般,*,*,*,*,*
??  記号,一般,*,*,*,*,*
日 名詞,一般,*,*,*,*,日,ヒ,ヒ
は 助詞,係助詞,*,*,*,*,は,ハ,ワ
たくさん    名詞,副詞可能,*,*,*,*,たくさん,タクサン,タクサン
雪 名詞,一般,*,*,*,*,雪,ユキ,ユキ
が 助詞,格助詞,一般,*,*,*,が,ガ,ガ
降っ  動詞,自立,*,*,五段・ラ行,連用タ接続,降る,フッ,フッ
て 助詞,接続助詞,*,*,*,*,て,テ,テ
いる  動詞,非自立,*,*,一段,基本形,いる,イル,イル
。 記号,句点,*,*,*,*,。,。,。
EOS
^C

Pythonからの利用

次にPythonから利用できるようにします。
参考サイトの3番目で

pip install http://mecab.googlecode.com/files/mecab-python-0.996.tar.gz

とありますがこちらを実行すると

HTTP error 404 ....

とエラーが発生しました。GoogleCodeは2016年1月25日で閉鎖されたようです。それで、mecab-python3をインストールします。

pip install mecab-python3

とすると無事インストールできました。

サンプル実行

よくあるサンプルを実行してみます。

mecab.py
# coding: utf-8

import MeCab
n = MeCab.Tagger()
print( n.parse("今日もあれしないとね") )

そしてコマンドラインから

# python mecab.py

と実行すると

今日  名詞,副詞可能,*,*,*,*,今日,キョウ,キョー
も 助詞,係助詞,*,*,*,*,も,モ,モ
あれ  動詞,自立,*,*,一段,連用形,あれる,アレ,アレ
し 動詞,自立,*,*,サ変・スル,未然形,する,シ,シ
ない  助動詞,*,*,*,特殊・ナイ,基本形,ない,ナイ,ナイ
と 助詞,接続助詞,*,*,*,*,と,ト,ト
ね 助詞,終助詞,*,*,*,*,ね,ネ,ネ
EOS

と無事表示されPythonからMecabが利用できました。さて何しようかな。