環境
- MacOS 10.11 (El Capitan)
- pip install mecab-python でインストールしたMeCab
辞書を作成する
vi user_dic.csv
使い方,-1,-1,1,名詞,一般,*,*,*,*,*,*,*,mydic
取扱説明書,-1,-1,1,名詞,一般,*,*,*,*,*,*,*,mydic
...
ユーザー辞書のコンパイル
$ /usr/local/Cellar/mecab/0.996/libexec/mecab/mecab-dict-index \
-d /usr/local/lib/mecab/dic/ipadic \
-u user.dic \
-f utf-8 \
-t utf-8 user.csv
- オプションの意味
- -d DIR: システム辞書があるディレクトリ
- -u FILE: FILE というユーザファイルを作成
- -f charset: CSVの文字コード
- -t charset: バイナリ辞書の文字コード
とのことなので、
/usr/local/Cellar/mecab/0.996/libexec/mecab/mecab-dict-index \
-d /usr/local/lib/mecab/dic/ipadic \
-u user_dic.dic \
-f utf-8 \
-t utf-8 \
user_dic.csv
user_dic.dicができた。
辞書の追加
vi /usr/local/etc/mecabrc
userdic = /Users/.../user_dic.dic
追加できた。
動作確認
$ mecab
取扱説明書
取扱説明書 名詞,一般,*,*,*,*,*,*,*,mydic
EOS
できたっぽい。
その他
動詞の追加は面倒らしい。
http://www.mwsoft.jp/programming/nlp/mecab_dictionary_customize.html