目的
mecabに用いる辞書をnaist-jdicへ変更する
環境
windows7 64bit
Mecabインストール済み
環境変数に~\Mecab\binのパスを通している
準備
- naist-jdicの辞書を取得する
ダウンロード先 https://ja.osdn.net/projects/naist-jdic/
今回は「naist-jdic (for MeCab) mecab-naist-jdic-0.6.3b-20111013」を選択
- 現在使っているMecabの文字コードを確認する
Mecabが認識する文字コードをコマンド「mecab -D」で確認する
現れた情報のcharsetを確認することで現在認識している文字コードが確認できる
実施手順
手順は以下の通り
1. naist-jdic辞書を指定の場所に置く
2. mecabrcを変更する
3. コマンドをたたく
1. naist-jdic辞書を指定の場所に置く
準備で取得した辞書を
~\Mecab\dic に置く
2. mecabrcを変更する
~\Mecab\etc に置いてある「mecabrc」を開き、
dicdir = $(rcpath)..\dic\ipadic
と書いてある場所を
;dicdir = $(rcpath)..\dic\ipadic
dicdir = $(rcpath)..\dic\mecab-naist-jdic-0.6.3b-20111013
と上書きする。
※上書きできない場合は、mecabrcをデスクトップ上などにコピーして上書きし、ファイルを置換すれば可能
3. コマンドをたたく
~\Mecab\dic\mecab-naist-jdic-0.6.3b-20111013まで移動し、以下のコマンドを実行
mecab-dict-index.exe -f euc -t (確認した文字コード)
「-f euc」はnaist-jdicの辞書に使われている文字コード
後は「mecab -D」で辞書情報が変更されたことを確認し、Mecabを動かして実際に文字コードの変更に問題がないか確認する
※追記
のコマンドで辞書が作成できなくなっていた。(2017/06/13)
mecab-dict-index.exe -d mecab-naist-jdic-0.6.3b-20111013 -f euc -t (確認した文字コード)
カレントディレクトリを辞書内に移動する方法で対処した。