Mecab
まずはMecabをインストール
sudo apt-get install mecab libmecab-dev mecab-ipadic mecab-ipadic-utf8
正常にインストールできているかを確認
$ mecab
君の名は
君 名詞,代名詞,一般,*,*,*,君,キミ,キミ
の 助詞,連体化,*,*,*,*,の,ノ,ノ
名 名詞,一般,*,*,*,*,名,ナ,ナ
は 助詞,係助詞,*,*,*,*,は,ハ,ワ
EOS
mecab-ipadic-NEologd
辞書を変更する(もとの辞書は固有名詞などが弱い)
$ git clone --depth 1 https://github.com/neologd/mecab-ipadic-neologd.git
$ cd mecab-ipadic-neologd
$ ./bin/install-mecab-ipadic-neologd -n -a
mecab-python
Python2の場合
$ pip install mecab-python
Python3の場合
$ pip3 install mecab-python3
上は環境によって違うかもしれない
確認
test.py
import sys
import MeCab
#Taggerの引数に-dオプションとmecab-ipadic-neologdの場所を指定する
# ↓場所の確認
# echo `mecab-config --dicdir`"/mecab-ipadic-neologd"
m = MeCab.Tagger("-d ../mecab-ipadic-neologd")
text = m.parse("君の名前は")
print( text)
$ python3 test.py
君 キミ 君 名詞-代名詞-一般
の ノ の 助詞-連体化
名前 ナマエ 名前 名詞-一般
は ハ は 助詞-係助詞
EOS
以上