LoginSignup
0
0

More than 5 years have passed since last update.

mecabをubuntu18.04にインストール

Posted at

mecabのインストールについてメモを残しておきます。

※この記事はubuntu18.04にmecabをインストールする場合を対象としています。

mecab公式サイト
http://taku910.github.io/mecab/#format

mecabインストールの前に

mecabの動作に必要なものとして、以下が指定されているので準備します。

  • C++コンパイラ (g++)
  • iconv

C++コンパイラについて

以下のコマンドを実行してインストールします。

sudo apt install g++

g++がインストールされたか確認します。

$ g++ --verison

以下のような出力であればインストールできています。

g++ (Ubuntu 7.3.0-27ubuntu1~18.04) 7.3.0
Copyright (C) 2017 Free Software Foundation, Inc.
This is free software; see the source for copying conditions.  There is NO
warranty; not even for MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.

iconv(libconv)について

以下コマンドを打ち、インストールされているか確認します。

iconv --version

インストールされてない場合、こちらからダウンロードできます。手順に従ってインストールして下さい。

mecabのインストール

公式とほぼ同じ手順ですが、ubuntuにインストールする場合は文字コードをutf8に指定して「./configure」を実行したほうが、文字化けせずにすみます。

 % tar zxfv mecab-X.X.tar.gz
 % cd mecab-X.X
 % ./configure --with-charset=utf8
 % make
 % make check
 % su
 # make install

辞書のインストール

mecabと同様に文字コードをutf8に指定します。

% tar zxfv mecab-ipadic-2.7.0-XXXX.tar.gz
% mecab-ipadic-2.7.0-XXXX
% ./configure --with-charset=utf8
% make
% su
# make install

mecabを実行

以下のコマンドでmecabを実行できます。

% mecab

試しに「私は学生です。」と入力してみます。
文字化けせず、以下のように形態素解析の結果が出力されたら成功です。

私は学生です。
私 名詞,代名詞,一般,*,*,*,私,ワタシ,ワタシ
は 助詞,係助詞,*,*,*,*,は,ハ,ワ
学生  名詞,一般,*,*,*,*,学生,ガクセイ,ガクセイ
です  助動詞,*,*,*,特殊・デス,基本形,です,デス,デス
。 記号,句点,*,*,*,*,。,。,。
EOS

参考文献

MeCab公式
http://taku910.github.io/mecab/#format

Linux Tutorials-Learn Linux Configuration
https://linuxconfig.org/how-to-install-g-the-c-compiler-on-ubuntu-18-04-bionic-beaver-linux

libconv
http://www.gnu.org/software/libiconv/#downloading

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0