tokyocabinetを使ってみたのでその手順のメモ
yumで必要なパッケージをインストール。
yum -y install bzip2-devel zlib-devel
次にtokyocabinetをwgetで拾ってきてinstall
見たときの最新のバージョンが1.4.45だった。
wget http://fallabs.com/tokyocabinet/tokyocabinet-1.4.45.tar.gz
tar xzvf tokyocabinet-1.4.45.tar.gz
cd tokyocabinet-1.4.45
./configure
make
make check
make install
インストールが完了
tokyocabinetの起動、動いてるっぽい。
tctmgr version
Tokyo Cabinet version 1.4.45 (908:1.0) for Linux
Copyright (C) 2006-2010 Mikio Hirabayashi
indexの作成をする
$ ruby wgettsv -allow 'http://d\.hatena\.ne\.jp/yutadayo' \
-max 10000 'http://d.hatena.ne.jp/yutadayo/' > intra.tsv
10分くらいでクロールが完了。
コマンドを打ってインデックスの作成を試みる。
$ tctmgr importtsv tctsearch.tct intra.tsv
$ tctmgr setindex -it qgram tctsearch.tct title
$ tctmgr setindex -it qgram tctsearch.tct body
数秒で完了。
検索UIもtokyocabinetに入っていたやつを使わせてもらった。
exampleディレクトリからコピーしてcgiが動くディレクトリに持ってくる。
exampleディレクトリでmakeしてできるtctsearch.cgi と tctsearch.tmplというファイルね。
先ほど作ったインデックスファイル(tctsearch.tct)も同じディレクトリに移動させておく。
$ cd tokyocabinet-1.4.45/example
$ make
$ cp tctsearch.cgi tctsearch.tmpl ~yutadayo/work/tokyocabinet
$ mv ~yutadayo/tokyocabinet/tctsearch.tct ~yutadayo/work/tokyocabinet
ブラウザでtctsearch.cgiにアクセスし
.cgi You don't have permission to access /
cgiの許可をしてないと怒られる。
http.confに下記を追加してapacheを再起動
ScriptAlias /cgi-bin/ /home/yutadayo/work/tokyocabinet
<Directory /home/yutadayo/work/tokyocabinet>
AllowOverride None
Options ExecCGI
Order allow,deny
Allow from all
</Directory>
アクセスするとちゃんと動いた。
導入までは結構簡単でした。