Ubuntu 18.04 LTSのPythonでMeCabを動かす方法についてまとめます。
MeCabのインストール
-
sudo apt install mecab libmecab-dev mecab-ipadic-utf8コマンドを実行し、MeCabをインストールします。 - (以下のいずれにも該当しない場合は飛ばしてください)
- 形態素解析辞書としてmecab-ipadic-NEologdを使う場合
-
sudo apt install git make curl xz-utils fileコマンドを実行し、必要なパッケージをインストールします。 -
cd /tmpコマンドを実行し、tmpディレクトリに移動します。 -
git clone --depth 1 https://github.com/neologd/mecab-ipadic-neologd.gitコマンドを実行し、mecab-ipadic-NEologdをcloneします。 -
cd mecab-ipadic-neologdコマンドを実行し、cloneしたディレクトリに移動します。 -
./bin/install-mecab-ipadic-neologd -nコマンドを実行し、mecab-ipadic-NEologdをインストールします。
※途中でインストールして良いか聞かれるのでyesと入力します。
※途中でかなり重くなります。
-
- 形態素解析辞書としてUniDicやmecab-unidic-NEologdを使う場合
-
UniDicをインストールします。
- APTを使ってUniDicをインストールする場合 (通常はこちら)
-
sudo apt install unidic-mecabコマンドを実行し、UniDicをインストールします。 -
sudo update-alternatives --config mecab-dictionaryコマンドを実行し、デフォルトの辞書をUniDicに変更します。
-
- 最新版のUniDicを使いたい場合
4. 「UniDic」国語研短単位自動解析用辞書|最新版ダウンロードから最新版のUniDicをダウンロードします。
5./usr/lib/mecab/dicディレクトリ内にUniDicを解凍します。
- APTを使ってUniDicをインストールする場合 (通常はこちら)
- 【形態素解析辞書としてmecab-unidic-NEologdを使う場合のみ】
-
sudo apt install git make curl xz-utils fileコマンドを実行し、必要なパッケージをインストールします。 -
cd /tmpコマンドを実行し、tmpディレクトリに移動します。 -
git clone --depth 1 https://github.com/neologd/mecab-unidic-neologdコマンドを実行し、mecab-unidic-NEologdをcloneします。 -
cd mecab-unidic-neologdコマンドを実行し、cloneしたディレクトリに移動します。 -
./bin/install-mecab-unidic-neologd -nコマンドを実行し、mecab-unidic-NEologdをインストールします。
※途中でインストールして良いか聞かれるのでyesと入力します。
※途中でかなり重くなります。
-
-
UniDicをインストールします。
- MeCab公式のPythonバインディングを用いる場合
- Python2の場合
pip install mecab-pythonコマンドを実行し、MeCab公式のPythonバインディングをインストールします。 - Python3の場合
pip install mecab-python3コマンドを実行し、MeCab公式のPythonバインディングをインストールします。
- Python2の場合
-
natto-pyを用いる場合
pip install natto-pyコマンドを実行し、natto-pyをインストールします。
mecab-ipadic-NEeologdやmecab-unidic-NEologdに関して
アップデート
週2回 (月, 木) アップデートが行われるようです。
-
cd /tmpコマンドを実行し、tmpディレクトリに移動します。
- mecab-ipadic-NEologdの場合
3.git clone --depth 1 https://github.com/neologd/mecab-ipadic-neologd.gitコマンドを実行し、mecab-ipadic-NEologdをcloneします。
4.cd mecab-ipadic-neologdコマンドを実行し、cloneしたディレクトリに移動します。
5../bin/install-mecab-ipadic-neologd -nコマンドを実行し、mecab-ipadic-NEologdをインストールします。 - mecab-unidic-NEologdの場合
3.git clone --depth 1 https://github.com/neologd/mecab-unidic-neologd.gitコマンドを実行し、mecab-unidic-NEologdをcloneします。
4.cd mecab-unidic-neologdコマンドを実行し、cloneしたディレクトリに移動します。
5../bin/install-mecab-unidic-neologd -nコマンドを実行し、mecab-unidic-NEologdをインストールします。
辞書の使用方法
IPAdicやUniDicの場合
MeCabの引数に-d /var/lib/mecab/dic/{辞書名}を与えます。
mecab-ipadic-NEeologdやmecab-unidic-NEologdの場合
MeCabの引数に-d /usr/lib/mecab/dic/{辞書名}を与えます。