AWS EC2上にChasenをインストールするメモ。
0. instance立ち上げ
EC2上にinstanceを立ち上げる。
とりあえず、お試しならt1.microでも良いかも。
AWS t1.micro
OS: Aamzon Linux
ツール、データはS3上に上げておくと、外部からダウンロードするより少し早いし、お財布にも少し優しい。
1. yum update
$ sudo yum update
2. swap設定
EC2instanceがt1.microのときswap領域を設定する
$ sudo dd if=/dev/zero of=/swap.img bs=1M count=2048
$ sudo chmod 600 /swap.img
$ sudo mkswap /swap.img
$ sudo vi /etc/fstab
以下を追加
/swap.img swap swap defaults 0 0
swapを有効にする
$ sudo swapon -a
3. 日本時間に設定
$ sudo vi /etc/sysconfig/clock
ZONE="Asia/Tokyo"
に書き換える。
$ sudo ln -sf /usr/share/zoneinfo/Asia/Tokyo /etc/localtime
$ sudo reboot
4 . epelリポジトリの有効化
Amazon Linux AMIでEPELの設定だけはすでに行われている。
EPELを使いたいパッケージのところでyum --enablerepo=epel install -y xxxxと実行する。
というのを確認したら、次のステップへ。
5. S3ツールのインストール (S3を利用しない場合は、不要)
$ sudo yum install gem
$ sudo yum install rubygem-aws-sdk
$ sudo yum -y --enablerepo epel install s3cmd
$ s3cmd --configure
Access KeyとSecret Keyを設定する
httpsを使うにyes
s3cmdで日本語を正しく扱うための設定
$ sudo vi /usr/lib/python2.6/site-packages/sitecustomize.py
/usr/lib/python2.6/site-packages/sitecustomize.py
import sys
sys.setdefaultencoding('utf-8')
6. 開発環境インストール
$ sudo yum -y install gcc*
$ sudo yum -y install make
$ sudo yum -y install ruby-devel
7. Dartsインストール
$ wget http://chasen.org/~taku/software/darts/src/darts-0.32.tar.gz
$ gtar xvzf darts-0.32.tar.gz
$ cd darts-0.32
$ ./configure
$ make
$ make check
$ sudo make install
8. ChaSenインストール
$ wget http://iij.dl.sourceforge.jp/chasen-legacy/56305/chasen-2.4.5.tar.gz
$ tar xzf chasen-2.4.5.tar.gz
$ cd chasen-2.4.5
$ sudo ./configure
$ sudo make
$ sudo make install
$ sudo vi /etc/ld.so.conf.d/usr-local.conf
$ cat usr-local.conf
/usr/local/lib
$ sudo ldconfig
9. ipadic をインストール
$ wget http://jaist.dl.sourceforge.jp/ipadic/24435/ipadic-2.7.0.tar.gz
$ tar zxf ipadic-2.7.0.tar.gz
$ cd ipadic-2.7.0
$ ./configure
辞書ファイルをUTF-8に変換
$ vi convert.sh
convert.sh
#!/bin/sh
for file in *.dic *.cha
do
if [ -f $file ]; then
echo $file
iconv -f euc-jp -t utf-8 $file > tmpfile
mv tmpfile $file
fi
done
exit
$ sh ./convert.sh
$ `chasen-config --mkchadic`/makemat -i w
$ `chasen-config --mkchadic`/makeda -i w chadic *.dic
$ sudo make install
10. chasenrcもUTF-8に変換
$ cd /usr/local/etc
$ sudo cp -p chasenrc chasenrc.orig
$ iconv -f euc-jp -t utf-8 chasenrc > /tmp/chasenrc.tmp
$ sudo mv /tmp/chasenrc.tmp chasenrc
$ sudo chown root:root chasenrc
11. テスト
$ chasen -iw
今日の天気は雨です。
今日 キョウ 今日 名詞-副詞可能
の ノ の 助詞-連体化
天気 テンキ 天気 名詞-一般
は ハ は 助詞-係助詞
雨 アメ 雨 名詞-一般
です デス です 助動詞 特殊・デス 基本形
。 。 。 記号-句点
EOS
参考URL:
Python - ChaSenのインストール - Qiita [キータ] http://qiita.com/yss44@github/items/cfc05860523d673d9000