背景
本当はFess10がリリースされているのでFess10を使った構築をしたかったが、試しにFess10.2で環境構築したところ、xlsxファイルなどを検索対象にできず、原因を調べたところ、Fess10から検索エンジンがSolrからElasticSearchに変更されていた。
Solrではxlsxファイルなどを検索対象にするプラグインがbuilt-inなのだが、ElasticSearchでは別途プラグインのインストールが必要で、しかもインストール方法がよく分からなかった。
このため、Fess10は諦めてしまった。
Fess10はインターフェースが格好良くなっているので残念。
動機
ファイルサーバにいっぱい溜まっているファイルの再活用ができていないのは問題。どうにかして検索性を上げて作業効率を上げたい。
また、IoTとかBig DataとかBIとか言われている訳ですが、検索エンジンのインフラ要素は、それらと共通する部分が多いと感じたので、多少なりとも活用することで、インフラ技術も向上させたい。
環境
試しに自分の環境で動作させたい為、ラップトップで実行環境を構築。
検索対象は、ホームディレクトリのDocumentsディレクトリ内。
Mac OS X El Capitan 10.11.6
butada-mac:bin butada$ java -version
java version "1.8.0_71"
Java(TM) SE Runtime Environment (build 1.8.0_71-b15)
Java HotSpot(TM) 64-Bit Server VM (build 25.71-b15, mixed mode)
手順
Fessをダウンロードする。
https://ja.osdn.net/projects/fess/downloads/63287/fess-server-9.4.2.zip/
fess-server-9.4.2
Fessをインストールする。
ダウンロードフォルダから
移動させるだけ。
cd /Users/butada/Documents
mv /Users/butada/Downloads/fess-server-9.4.2 .
起動スクリプトの実行権限を与える
cd fess-server-9.4.2
cd bin
chmod +x startup.sh
Fessを起動
./startup.sh
Safariで開く。
Fessの管理画面で設定する
ユーザー名とパスワードは共に「admin」。
クロールおよびクロールジョブを設定する
クロール→ファイルシステム
から「新規作成」
設定名: test_for_filesystem
パス: file:/Users/butada/Documents/
以上を入力したら「作成」。
システム→ジョブ管理
から「Crawler」の「詳細」
更に、詳細を開いたら「開始」
これで、設定したクロールを含めて
ジョブが実行される。(たぶん)
ジョブの状態を確認する
システム情報→ジョブログ
から確認できる。
ステータスが「RUNNING」になっていれば動作している。
検索結果の確認
http://localhost:8080/fess/
を開き、検索キーワード(xlsxファイルに含まれる文字列)を入力して「検索」
期待された検索結果が表示されればOK。
まとめ
まだ実運用を始めていないので、この設定でどれくらいのファイル数などの規模に対応できるのかがわからないが、まずはこれで様子を見たいと思います。
あとは、outlookの検索が遅いので、それを解消する手段としてFessが活躍できると嬉しい。