ちゃお・・・†
はじめに
64-bit版Pythonでは、MeCab公式サイトで配布されているWindows用32-bit版MeCabバイナリが実行できません。そこで、Windows用64-bit版MeCabバイナリが必要となるわけですが、わざわざ自分でMeCabのコードをいじってコンパイルするのは面倒です。
そこで、わたしが作ったWindows用64-bit版MeCabバイナリのインストーラーの紹介をしたいと思います。
インストール
まず、Windows用64-bit版MeCabバイナリのインストーラー (拡張子に .exe
が付いてるもの) を下記URLからダウンロードします。新しいものほど改善されているので新しいバイナリの利用を推奨します。
使い方
まず、前のセクションでダウンロードした exe
形式のインストーラーファイルを実行します。インストーラーでの手順はMeCab公式インストーラーと全く同じです。辞書をビルドする時の文字コードは昨今の風潮により UTF-8
を選択するとよいです。ただしWindowsのコマンドプロンプトの初期設定の文字コードは Shit-JIS
なので、WindowsのコマンドプロンプトでしかMeCabを使わない場合は Shift-JIS
をおすすめします。
メリット/デメリット
メリット
- 64-bit版にするためにMeCab公式のコードをわざわざ自分で書き換えなくて済む
- PyPIの
mecab
ラッパーを入れることで64-bit版PythonでMeCabが使えるようになる - もしWindowsが32-bitソフトウェアのサポートをやめた場合でも問題なくMeCabを使うことが出来る
- 現時点では公式のMeCabリポジトリは2018年3月でコミット止まっていますが、Windows用64-bit版MeCabの作者 (わたし) はサポートする気がある
デメリット
- CaboChaの公式Windowsバイナリは32-bitなので、Windows用64-bit版MeCabを入れるとCaboChaが動かなくなる
さいごに
昨今はTensorFlowやPyTorchなど64-bit版Pythonでしか動かないライブラリ/パッケージが増えています。なのでWindowsでMeCabを使ってテキストデータの前処理をしたいときに、わざわざ32-bit版Pythonに切り替えるのは面倒です。そこで今回紹介した64-bit版MeCabバイナリを入れて、pipで mecab
ライブラリを入れるとそうした切り替えの手間が省けて楽になります。
ただし、64-bit版MeCabバイナリを入れるとCaboChaが動かなくなるので、CaboChaが必要な方は公式の32-bit版MeCabを利用してください。他にも動かなくなるライブラリやアプリがあるかもしれません。そうした場合も公式の32-bit版MeCabを利用してください。
厚かましいお願い
もしも気に入ったら64-bit版MeCabのGitHubリポジトリにスターをつけていただけると嬉しいです。たったの1クリックだけで、わたしの開発のモチベーションがアップします。
スターだけじゃ物足りない!という方は、64-bit版MeCabのGitHubリポジトリのSponsorボタンを押すとわたしにお金や物を送ることが出来ます。わたしの開発のモチベーションがかなりアップします。