Ubuntu 18.04 LTSのPythonでMeCabを動かす方法についてまとめます。
MeCabのインストール
-
sudo apt install mecab libmecab-dev mecab-ipadic-utf8
コマンドを実行し、MeCabをインストールします。 - (以下のいずれにも該当しない場合は飛ばしてください)
- 形態素解析辞書としてmecab-ipadic-NEologdを使う場合
-
sudo apt install git make curl xz-utils file
コマンドを実行し、必要なパッケージをインストールします。 -
cd /tmp
コマンドを実行し、tmpディレクトリに移動します。 -
git clone --depth 1 https://github.com/neologd/mecab-ipadic-neologd.git
コマンドを実行し、mecab-ipadic-NEologdをcloneします。 -
cd mecab-ipadic-neologd
コマンドを実行し、cloneしたディレクトリに移動します。 -
./bin/install-mecab-ipadic-neologd -n
コマンドを実行し、mecab-ipadic-NEologdをインストールします。
※途中でインストールして良いか聞かれるのでyes
と入力します。
※途中でかなり重くなります。
-
- 形態素解析辞書としてUniDicやmecab-unidic-NEologdを使う場合
-
UniDicをインストールします。
- APTを使ってUniDicをインストールする場合 (通常はこちら)
-
sudo apt install unidic-mecab
コマンドを実行し、UniDicをインストールします。 -
sudo update-alternatives --config mecab-dictionary
コマンドを実行し、デフォルトの辞書をUniDicに変更します。
-
- 最新版のUniDicを使いたい場合
- 「UniDic」国語研短単位自動解析用辞書|最新版ダウンロードから最新版のUniDicをダウンロードします。
-
/usr/lib/mecab/dic
ディレクトリ内にUniDicを解凍します。
- APTを使ってUniDicをインストールする場合 (通常はこちら)
- 【形態素解析辞書としてmecab-unidic-NEologdを使う場合のみ】
-
sudo apt install git make curl xz-utils file
コマンドを実行し、必要なパッケージをインストールします。 -
cd /tmp
コマンドを実行し、tmpディレクトリに移動します。 -
git clone --depth 1 https://github.com/neologd/mecab-unidic-neologd
コマンドを実行し、mecab-unidic-NEologdをcloneします。 -
cd mecab-unidic-neologd
コマンドを実行し、cloneしたディレクトリに移動します。 -
./bin/install-mecab-unidic-neologd -n
コマンドを実行し、mecab-unidic-NEologdをインストールします。
※途中でインストールして良いか聞かれるのでyes
と入力します。
※途中でかなり重くなります。
-
-
UniDicをインストールします。
- 形態素解析辞書としてmecab-ipadic-NEologdを使う場合
-
- MeCab公式のPythonバインディングを用いる場合
- Python2の場合
pip install mecab-python
コマンドを実行し、MeCab公式のPythonバインディングをインストールします。 - Python3の場合
pip install mecab-python3
コマンドを実行し、MeCab公式のPythonバインディングをインストールします。
- Python2の場合
-
natto-py
を用いる場合
pip install natto-py
コマンドを実行し、natto-py
をインストールします。
- MeCab公式のPythonバインディングを用いる場合
mecab-ipadic-NEeologdやmecab-unidic-NEologdに関して
アップデート
週2回 (月, 木) アップデートが行われるようです。
-
cd /tmp
コマンドを実行し、tmpディレクトリに移動します。 -
- mecab-ipadic-NEologdの場合
-
git clone --depth 1 https://github.com/neologd/mecab-ipadic-neologd.git
コマンドを実行し、mecab-ipadic-NEologdをcloneします。 -
cd mecab-ipadic-neologd
コマンドを実行し、cloneしたディレクトリに移動します。 -
./bin/install-mecab-ipadic-neologd -n
コマンドを実行し、mecab-ipadic-NEologdをインストールします。
-
- mecab-unidic-NEologdの場合
-
git clone --depth 1 https://github.com/neologd/mecab-unidic-neologd.git
コマンドを実行し、mecab-unidic-NEologdをcloneします。 -
cd mecab-unidic-neologd
コマンドを実行し、cloneしたディレクトリに移動します。 -
./bin/install-mecab-unidic-neologd -n
コマンドを実行し、mecab-unidic-NEologdをインストールします。
-
- mecab-ipadic-NEologdの場合
辞書の使用方法
IPAdicやUniDicの場合
MeCabの引数に-d /var/lib/mecab/dic/{辞書名}
を与えます。
mecab-ipadic-NEeologdやmecab-unidic-NEologdの場合
MeCabの引数に-d /usr/lib/mecab/dic/{辞書名}
を与えます。