Ubuntu 18.04 LTSのPythonでMeCabを動かす方法についてまとめます。
#MeCabのインストール
-
sudo apt install mecab libmecab-dev mecab-ipadic-utf8
コマンドを実行し、MeCabをインストールします。 - (以下のいずれにも該当しない場合は飛ばしてください)
- 形態素解析辞書としてmecab-ipadic-NEologdを使う場合
-
sudo apt install git make curl xz-utils file
コマンドを実行し、必要なパッケージをインストールします。 -
cd /tmp
コマンドを実行し、tmpディレクトリに移動します。 -
git clone --depth 1 https://github.com/neologd/mecab-ipadic-neologd.git
コマンドを実行し、mecab-ipadic-NEologdをcloneします。 -
cd mecab-ipadic-neologd
コマンドを実行し、cloneしたディレクトリに移動します。 -
./bin/install-mecab-ipadic-neologd -n
コマンドを実行し、mecab-ipadic-NEologdをインストールします。
※途中でインストールして良いか聞かれるのでyes
と入力します。
※途中でかなり重くなります。
-
- 形態素解析辞書としてUniDicやmecab-unidic-NEologdを使う場合
-
UniDicをインストールします。
- APTを使ってUniDicをインストールする場合 (通常はこちら)
-
sudo apt install unidic-mecab
コマンドを実行し、UniDicをインストールします。 -
sudo update-alternatives --config mecab-dictionary
コマンドを実行し、デフォルトの辞書をUniDicに変更します。
-
- 最新版のUniDicを使いたい場合
4. 「UniDic」国語研短単位自動解析用辞書|最新版ダウンロードから最新版のUniDicをダウンロードします。
5./usr/lib/mecab/dic
ディレクトリ内にUniDicを解凍します。
- APTを使ってUniDicをインストールする場合 (通常はこちら)
- 【形態素解析辞書としてmecab-unidic-NEologdを使う場合のみ】
-
sudo apt install git make curl xz-utils file
コマンドを実行し、必要なパッケージをインストールします。 -
cd /tmp
コマンドを実行し、tmpディレクトリに移動します。 -
git clone --depth 1 https://github.com/neologd/mecab-unidic-neologd
コマンドを実行し、mecab-unidic-NEologdをcloneします。 -
cd mecab-unidic-neologd
コマンドを実行し、cloneしたディレクトリに移動します。 -
./bin/install-mecab-unidic-neologd -n
コマンドを実行し、mecab-unidic-NEologdをインストールします。
※途中でインストールして良いか聞かれるのでyes
と入力します。
※途中でかなり重くなります。
-
-
UniDicをインストールします。
- MeCab公式のPythonバインディングを用いる場合
- Python2の場合
pip install mecab-python
コマンドを実行し、MeCab公式のPythonバインディングをインストールします。 - Python3の場合
pip install mecab-python3
コマンドを実行し、MeCab公式のPythonバインディングをインストールします。
- Python2の場合
-
natto-py
を用いる場合
pip install natto-py
コマンドを実行し、natto-py
をインストールします。
#mecab-ipadic-NEeologdやmecab-unidic-NEologdに関して
##アップデート
週2回 (月, 木) アップデートが行われるようです。
-
cd /tmp
コマンドを実行し、tmpディレクトリに移動します。
- mecab-ipadic-NEologdの場合
3.git clone --depth 1 https://github.com/neologd/mecab-ipadic-neologd.git
コマンドを実行し、mecab-ipadic-NEologdをcloneします。
4.cd mecab-ipadic-neologd
コマンドを実行し、cloneしたディレクトリに移動します。
5../bin/install-mecab-ipadic-neologd -n
コマンドを実行し、mecab-ipadic-NEologdをインストールします。 - mecab-unidic-NEologdの場合
3.git clone --depth 1 https://github.com/neologd/mecab-unidic-neologd.git
コマンドを実行し、mecab-unidic-NEologdをcloneします。
4.cd mecab-unidic-neologd
コマンドを実行し、cloneしたディレクトリに移動します。
5../bin/install-mecab-unidic-neologd -n
コマンドを実行し、mecab-unidic-NEologdをインストールします。
##辞書の使用方法
###IPAdicやUniDicの場合
MeCabの引数に-d /var/lib/mecab/dic/{辞書名}
を与えます。
###mecab-ipadic-NEeologdやmecab-unidic-NEologdの場合
MeCabの引数に-d /usr/lib/mecab/dic/{辞書名}
を与えます。
#関連記事