mecabのインストールについてメモを残しておきます。
※この記事はubuntu18.04にmecabをインストールする場合を対象としています。
mecab公式サイト
http://taku910.github.io/mecab/#format
mecabインストールの前に
mecabの動作に必要なものとして、以下が指定されているので準備します。
- C++コンパイラ (g++)
- iconv
C++コンパイラについて
以下のコマンドを実行してインストールします。
sudo apt install g++
g++がインストールされたか確認します。
$ g++ --verison
以下のような出力であればインストールできています。
g++ (Ubuntu 7.3.0-27ubuntu1~18.04) 7.3.0
Copyright (C) 2017 Free Software Foundation, Inc.
This is free software; see the source for copying conditions. There is NO
warranty; not even for MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.
iconv(libconv)について
以下コマンドを打ち、インストールされているか確認します。
iconv --version
インストールされてない場合、こちらからダウンロードできます。手順に従ってインストールして下さい。
mecabのインストール
公式とほぼ同じ手順ですが、ubuntuにインストールする場合は文字コードをutf8に指定して「./configure」を実行したほうが、文字化けせずにすみます。
% tar zxfv mecab-X.X.tar.gz
% cd mecab-X.X
% ./configure --with-charset=utf8
% make
% make check
% su
# make install
辞書のインストール
mecabと同様に文字コードをutf8に指定します。
% tar zxfv mecab-ipadic-2.7.0-XXXX.tar.gz
% mecab-ipadic-2.7.0-XXXX
% ./configure --with-charset=utf8
% make
% su
# make install
mecabを実行
以下のコマンドでmecabを実行できます。
% mecab
試しに「私は学生です。」と入力してみます。
文字化けせず、以下のように形態素解析の結果が出力されたら成功です。
私は学生です。
私 名詞,代名詞,一般,*,*,*,私,ワタシ,ワタシ
は 助詞,係助詞,*,*,*,*,は,ハ,ワ
学生 名詞,一般,*,*,*,*,学生,ガクセイ,ガクセイ
です 助動詞,*,*,*,特殊・デス,基本形,です,デス,デス
。 記号,句点,*,*,*,*,。,。,。
EOS
参考文献
MeCab公式
http://taku910.github.io/mecab/#format
Linux Tutorials-Learn Linux Configuration
https://linuxconfig.org/how-to-install-g-the-c-compiler-on-ubuntu-18-04-bionic-beaver-linux