Qiita Teams that are logged in
You are not logged in to any team

Log in to Qiita Team
Community
OrganizationAdvent CalendarQiitadon (β)
Service
Qiita JobsQiita ZineQiita Blog
Help us understand the problem. What is going on with this article?

windowsでmecabの辞書をnaist-jdicに切り替える

More than 3 years have passed since last update.

目的

mecabに用いる辞書をnaist-jdicへ変更する

環境

windows7 64bit
Mecabインストール済み
環境変数に~\Mecab\binのパスを通している

準備

  • naist-jdicの辞書を取得する

ダウンロード先 https://ja.osdn.net/projects/naist-jdic/
今回は「naist-jdic (for MeCab) mecab-naist-jdic-0.6.3b-20111013」を選択

  • 現在使っているMecabの文字コードを確認する

Mecabが認識する文字コードをコマンド「mecab -D」で確認する
現れた情報のcharsetを確認することで現在認識している文字コードが確認できる

実施手順

手順は以下の通り
1. naist-jdic辞書を指定の場所に置く
2. mecabrcを変更する
3. コマンドをたたく

1. naist-jdic辞書を指定の場所に置く

準備で取得した辞書を
~\Mecab\dic に置く

2. mecabrcを変更する

~\Mecab\etc に置いてある「mecabrc」を開き、

dicdir = $(rcpath)..\dic\ipadic

と書いてある場所を

;dicdir = $(rcpath)..\dic\ipadic
dicdir = $(rcpath)..\dic\mecab-naist-jdic-0.6.3b-20111013

と上書きする。

※上書きできない場合は、mecabrcをデスクトップ上などにコピーして上書きし、ファイルを置換すれば可能

3. コマンドをたたく

~\Mecab\dic\mecab-naist-jdic-0.6.3b-20111013まで移動し、以下のコマンドを実行

mecab-dict-index.exe -f euc -t (確認した文字コード)

「-f euc」はnaist-jdicの辞書に使われている文字コード

後は「mecab -D」で辞書情報が変更されたことを確認し、Mecabを動かして実際に文字コードの変更に問題がないか確認する

※追記 
mecab-dict-index.exe -d mecab-naist-jdic-0.6.3b-20111013 -f euc -t (確認した文字コード)
のコマンドで辞書が作成できなくなっていた。(2017/06/13)
カレントディレクトリを辞書内に移動する方法で対処した。

mamezou
先進の工学的手法と独自のスタンス。お客様とともにビジネスを活かすITを追求します。
http://www.mamezou.com/
Why not register and get more from Qiita?
  1. We will deliver articles that match you
    By following users and tags, you can catch up information on technical fields that you are interested in as a whole
  2. you can read useful information later efficiently
    By "stocking" the articles you like, you can search right away