@aridake (圭吾 有田)

Are you sure you want to delete the question?

Leaving a resolved question undeleted may help others!

mecab windowsでneologdのシステム辞書(utf8)の設定が出来ない

こんにちは

当方windows10でmecabの新語辞書(neologd)のutf8を使用しようとしているのですが
ユーザー辞書の設定は
https://qiita.com/zincjp/items/c61c441426b9482b5a48
こちらを見ながら出来たのですが

https://qiita.com/zincjp/items/e491f1712a701ad91a4f
こちらを見ながらシステム辞書の設定をしようとしたところ、途中で固まってしまい、正しく出来ませんでした(汗)

【ここまでは問題なく進めました】
管理者でコマンドプロンプト起動

cd %homepath%

git clone --depth 1 https://github.com/neologd/mecab-ipadic-neologd.git

cd mecab-ipadic-neologd\seed
dir

7z X *.xz

copy .csv "c:\Program Files (x86)\MeCab\dic\ipadic"
del "c:\Program Files (x86)\MeCab\dic\ipadic\mecab-user-dict-seed.
"

cd "c:\Program Files (x86)\MeCab\dic\ipadic"

【問題の実行箇所】
mecab-dict-index -f utf-8 -t shift-jis

【実行結果】
c:\Program Files (x86)\MeCab\dic\ipadic>mecab-dict-index -f utf-8 -t shift-jis
reading .\unk.def ... 40
emitting double-array: 100% |###########################################|
.\model.def is not found. skipped.
reading .\Adj.csv ... 27210
reading .\Adnominal.csv ... 135
reading .\Adverb.csv ... 3032
reading .\Auxil.csv ... 199
reading .\Conjunction.csv ... 171
reading .\Filler.csv ... 19
reading .\Interjection.csv ... 252
reading .\neologd-adjective-exp-dict-seed.20151126.csv ... 1051146
reading .\neologd-adjective-exp-dict-seed.20151126_1.csv ... 1051146
reading .\neologd-adjective-exp-dict-seed.20151126_2.csv ... 1051146
reading .\neologd-adjective-exp-dict-seed.20151126_3.csv ... 1051146
reading .\neologd-adjective-exp-dict-seed.20151126_4.csv ... 1051146
reading .\neologd-adjective-exp-dict-seed.20151126_5.csv ...

と、reading .\neologd-adjective-exp-dict-seed.20151126_5.csv ...
ここでとまってしまい、固まってしまいます。
メモリ不足ということなのでしょうか?

なんとかローカル環境でmecabのneologdをきちんと使えるようにしたいです
よろしくお願いいたします。

0 likes

2Answer

システム辞書をどう設定したか、何を実行してどこで RuntimeError が出たか分からないと答えようがありません。

  • システム辞書を設定した際の手順や入力したコマンド
  • 設定手順の参考にした書籍や web ページがあれば、そのタイトルやリンク
  • 何をして RuntimeError が出たか。スクリプトを実行して出たならそのスクリプト全文
  • 表示された RuntimeError 全文

を、質問文に追記してください(この回答へのコメントではなく)。

0Like

Comments

  1. @aridake

    Questioner

    こちらご指摘ありがとうございます、質問の仕方を更新しました。
    アドバイスありがとうございます(汗)
  2. ありがごうございます!十分な情報だと思います。新しく回答しますね。
  3. @aridake

    Questioner

    ありがとうございます・・・!!(涙)

メモリ不足のような感じがします。

neologd-adjective-exp-dict-seed.20151126.csv の他に、ほぼ同名で名前の後ろに連番がついた neologd-adjective-exp-dict-seed.20151126_1.csv が(1から5まで)あるのが気になりますね。

手元で試しましたが、ダウンロードしてきた辞書データは連番なしのファイルしか入っていませんでした。連番ファイルはどれも行数が1051146行のようですから、ファイルのコピーを間違えて同じデータを複製したのではないでしょうか。辞書の複製をいくつも処理して想定以上のメモリを消費した可能性がありそうです。

連番ファイルを削除するなり別の場所に移すなりしてから mecab-dict-index -f utf-8 -t shift-jis を再実行してみては。

0Like

Comments

  1. @aridake

    Questioner

    uasiさん

    こちらアドバイスありがとうございました!!

    windowsでmecab neologd出来ました!!!
    本当に助かりました、、ありがとうございました!!

Your answer might help someone💌