#mecabの準備
mecabのインストール
$ brew install mecab
mecabの辞書をインストール
$ brew install mecab-ipadic
mecabの辞書をパワーアップ
$ cd mecab-ipadic-neologd
$ ./bin/install-mecab-ipadic-neologd -n
辞書が入っている場所はこのコマンドで調べられる。
$ echo `mecab-config --dicdir`"/mecab-ipadic-neologd"
mecab-python3をインストール
$ brew install swig
$ pip install mecab-python3
Python3からMeCabを使う - Qiitaを参考に実行
mecab.py
import MeCab
# 変数には辞書のファイルパスを指定する
mecab = MeCab.Tagger ('-d /usr/local/lib/mecab/dic/mecab-ipadic-neologd')
text = '解析したいテキスト'
mecab.parse('')#文字列がGCされるのを防ぐ
node = mecab.parseToNode(text)
while node:
#単語を取得
word = node.surface
#品詞を取得
pos = node.feature.split(",")[1]
print('{0} , {1}'.format(word, pos))
#次の単語に進める
node = node.next
参考
mecab-ipadic-neologd/README.ja.md at master · neologd/mecab-ipadic-neologd · GitHub
Python3からMeCabを使う - Qiita