Python3からMeCabを使う

  • 39
    いいね
  • 0
    コメント
この記事は最終更新日から1年以上が経過しています。

日本語の形態素解析エンジン"MeCab"をMacにインストールしてPython3から利用する方法をまとめました。

MeCabと辞書をインストール

まずHomebrewでMeCabと辞書をインストールします。

$ brew install mecab
$ brew install mecab-ipadic

mecab-ipadic-NEologdをインストール

mecab-ipadic-NEologdをインストールします。
これはWeb上の新語をデフォルトの辞書に追加したものです。
必須ではありませんが便利なので入れておきます。
以下のコマンドでインストールできます。
詳しくはGitHubページをみてください。

$ brew install git curl xz
$ git clone --depth 1 git@github.com:neologd/mecab-ipadic-neologd.git
$ cd mecab-ipadic-neologd
$ ./bin/install-mecab-ipadic-neologd -n

mecab-python3をインストール

次にpipでmecab-python3をインストールします。

$ pip install mecab-python3

これで、Python3からMeCabが使えるようになりました。
以下に、サンプルコードを載せておきます。
MeCab.Taggerで指定するパスは

$ echo `mecab-config --dicdir`"/mecab-ipadic-neologd"

で調べられます。

import MeCab

mecab = MeCab.Tagger ('-d /usr/local/lib/mecab/dic/mecab-ipadic-neologd')

text = '解析したいテキスト'
mecab.parse('')#文字列がGCされるのを防ぐ
node = mecab.parseToNode(text)
while node:
    #単語を取得
    word = node.surface
    #品詞を取得
    pos = node.feature.split(",")[1]
    print('{0} , {1}'.format(word, pos))
    #次の単語に進める
    node = node.next

出力結果

 , *
解析 , サ変接続
し , 自立
たい , *
テキスト , 一般
 , *

参考

https://github.com/neologd/mecab-ipadic-neologd
http://shogo82148.github.io/blog/2015/12/20/mecab-in-python3-final/