LoginSignup
0
0

More than 3 years have passed since last update.

手順メモ: ec2でmecabをインストールする

Last updated at Posted at 2019-11-28

前提

  • small以上のec2インスタンスを作成しておく。

  • 必要なファイルを用意する

    • mecabから本体と辞書のtarファイルをダウンロードして、s3の適当なバケットにアップロードする
  • 作成するディレクトリ構造(自由に決めてもらってかまわない)

    src
     └── api
         ├── asset
         │   ├── mecab-0.996.tar.gz
         │   └── mecab-ipadic-2.7.0-20070801.tar.gz
         └── dev
             └── mecab-0.996
                 ├── mecab-ipadic-2.7.0-20070801
                 └── mecab-ipadic-neologd

手順

## ec2に最初にログインしたときに、yumをアップデート
$ sudo yum update -y

## 日本時間に設定
## ZONE="Asia/Tokyo"に書き換える。
$ sudo vi /etc/sysconfig/clock
$ sudo ln -sf /usr/share/zoneinfo/Asia/Tokyo /etc/localtime
$ sudo reboot

## reboot後、sudoにパスワードが求められるので、一旦ec2から抜ける
$ sudo yum -y install -y gcc* 
$ sudo yum -y install -y make
$ sudo yum install -y git
$ sudo yum install -y patch

## S3に適当なバケットを作り、mecab, neologdを保存する
## ec2にs3のオブジェクトをgetできるIAMロールを付与する
$ mkdir -p src/api/dev
$ aws s3 cp s3://バケット名/hogehoge/mecab-0.996.tar.gz .
$ tar zxvf ../../asset/mecab-0.996.tar.gz
$ cd mecab-0.996
$ ./configure --with-charset=utf8
$ make
$ sudo make install
$ which mecab
/usr/local/bin/mecab
$ sudo bash -c 'echo "/usr/local/lib" >> /etc/ld.so.conf.d/usr-local.conf'
$ sudo ldconfig

## 辞書をインストール IPA (Neologdを利用するのでスキップしてもかまない)
$ aws s3 cp s3://バケット名/hogehoge/mecab-ipadic-2.7.0-20070801.tar.gz .
$ tar zxvf ../../asset/mecab-ipadic-2.7.0-20070801.tar.gz
$ cd mecab-ipadic-2.7.0-20070801
$ ./configure --with-charset=utf8
$ make
$ sudo make install

## 辞書をインストール Neologd
$ cd ../
$ git clone --depth 1 https://github.com/neologd/mecab-ipadic-neologd.git
$ ./bin/install-mecab-ipadic-neologd -n -y

## 下記ディレクトリにNeologdがあれば良い
$ ls -la /usr/local/lib/mecab/dic/
ipadic/               mecab-ipadic-neologd/ 

## mecab+Neologdの動作確認
$ mecab -d /usr/local/lib/mecab/dic/mecab-ipadic-neologd/
ブラタモリを見た
ブラタモリ 名詞,固有名詞,一般,*,*,*,ブラタモリ,ブラタモリ,ブラタモリ
を 助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
見 動詞,自立,*,*,一段,連用形,見る,ミ,ミ
た 助動詞,*,*,*,特殊・タ,基本形,た,タ,タ
EOS

mecabの設定完了!

メモ

  • 手元のマシンにあるmecabのtarファイルをec2に持っていきたいとき、aws-cliの他にs3cmdを使う方法もある。

  • mecabの辞書について
    ipaかneologdどちらでもかまないが、neologdはipaより固有名詞をうまく分けてくれる。

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0