前提
-
small以上のec2インスタンスを作成しておく。
- ※mecab-ipadic-neologd をインストールする際に、メモリに1.5G以上の空きがないとビルドが落ちてしまうから
-
必要なファイルを用意する
- mecabから本体と辞書のtarファイルをダウンロードして、s3の適当なバケットにアップロードする
-
作成するディレクトリ構造(自由に決めてもらってかまわない)
src
└── api
├── asset
│ ├── mecab-0.996.tar.gz
│ └── mecab-ipadic-2.7.0-20070801.tar.gz
└── dev
└── mecab-0.996
├── mecab-ipadic-2.7.0-20070801
└── mecab-ipadic-neologd
手順
## ec2に最初にログインしたときに、yumをアップデート
$ sudo yum update -y
## 日本時間に設定
## ZONE="Asia/Tokyo"に書き換える。
$ sudo vi /etc/sysconfig/clock
$ sudo ln -sf /usr/share/zoneinfo/Asia/Tokyo /etc/localtime
$ sudo reboot
## reboot後、sudoにパスワードが求められるので、一旦ec2から抜ける
$ sudo yum -y install -y gcc*
$ sudo yum -y install -y make
$ sudo yum install -y git
$ sudo yum install -y patch
## S3に適当なバケットを作り、mecab, neologdを保存する
## ec2にs3のオブジェクトをgetできるIAMロールを付与する
$ mkdir -p src/api/dev
$ aws s3 cp s3://バケット名/hogehoge/mecab-0.996.tar.gz .
$ tar zxvf ../../asset/mecab-0.996.tar.gz
$ cd mecab-0.996
$ ./configure --with-charset=utf8
$ make
$ sudo make install
$ which mecab
/usr/local/bin/mecab
$ sudo bash -c 'echo "/usr/local/lib" >> /etc/ld.so.conf.d/usr-local.conf'
$ sudo ldconfig
## 辞書をインストール IPA (Neologdを利用するのでスキップしてもかまない)
$ aws s3 cp s3://バケット名/hogehoge/mecab-ipadic-2.7.0-20070801.tar.gz .
$ tar zxvf ../../asset/mecab-ipadic-2.7.0-20070801.tar.gz
$ cd mecab-ipadic-2.7.0-20070801
$ ./configure --with-charset=utf8
$ make
$ sudo make install
## 辞書をインストール Neologd
$ cd ../
$ git clone --depth 1 https://github.com/neologd/mecab-ipadic-neologd.git
$ ./bin/install-mecab-ipadic-neologd -n -y
## 下記ディレクトリにNeologdがあれば良い
$ ls -la /usr/local/lib/mecab/dic/
ipadic/ mecab-ipadic-neologd/
## mecab+Neologdの動作確認
$ mecab -d /usr/local/lib/mecab/dic/mecab-ipadic-neologd/
ブラタモリを見た
ブラタモリ 名詞,固有名詞,一般,*,*,*,ブラタモリ,ブラタモリ,ブラタモリ
を 助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
見 動詞,自立,*,*,一段,連用形,見る,ミ,ミ
た 助動詞,*,*,*,特殊・タ,基本形,た,タ,タ
EOS
mecabの設定完了!