はじめに
社内でFessサーバ立てた時の設定メモ。
書いた記事(個人開発PaaS比較)がちょっとバズって浮足立ってるので、(ほぼ確実に)バズらない記事を上げて心を落ち着けたい。
バージョン:12.3
公式ドキュメント:https://fess.codelibs.org/ja/
設定ファイルとか画面外のヤツ
もろもろ
以下を見ながら設定するだけなので、特に言うことないっす。
heapサイズ変えました。
https://fess.codelibs.org/ja/12.3/config/system.html
/etc/fess/fess_config.properties
jcifs.smb.SmbException
が発生して、アクセス出来ないときは、
jvm.crawler.optionsの以下のtrue/falseをいじれば、だいたいなんとかなるはず。1
-Djcifs.smb.client.ipcSigningEnforced=true\n\
-Djcifs.smb.client.signingPreferred=true\n\
-Djcifs.smb.client.enableSMB1=true\n\
-Djcifs.smb.client.enableSMB2=true\n\
管理画面設定
全般
除外するエラーの種類
ここで指定したエラーは、「障害数のしきい値」を超えても、クロール対象になります。2
以下を指定しています。正規表現で複数指定できます。3
org.codelibs.fess.es.client.FessEsClientException|org.codelibs.fess.exception.ContentNotFoundException
org.codelibs.fess.es.client.FessEsClientException
URLエンコードに失敗して、対象が見つからず、タイムアウトしている様子。
何が原因かわからないが、連続で発生しているわけじゃなさそうなので、ひとまず指定。
org.codelibs.fess.exception.ContentNotFoundException
ファイルが存在しなかった時に発生します。今は無くなったかもしれないですけど、未来で復活するかもしれないので指定。
除外してはいけないエラー
基本的に、以下は指定してはいけない。(はず)
org.codelibs.fess.crawler.exception.MaxLengthExceededException
ファイルサイズが大きい時に発生します。ファイルサイズが小さくなることは稀。指定した場合、クローラがout of memoryで死ぬ可能性が高くなると思われる。
障害数のしきい値
とりあえず 5
にしてます。
LDAP
以下記事参考にすればたぶんなんとかなるはず。
Rocket.Chat 設定もろもろ#LDAP
クローラ
WEBは使ってない
ファイルシステム
パス
以下を対象にしたいなら
\\filesv\abc\def\
こんな感じ
smb://filesv/abc/def
要は以下。
- 頭の
\\
→smb:
- 頭以外の
\
→/
除外するパス
重いことが多いファイルを除外してます。
.*\.exe$|.*\.zip$|.*\.war$|.*\.jar$|.*\.tar\.gz$|.*\.tmp$|.*Thumbs\.db$|.*\.lnk$|.*\.accdb$|.*\.msp$|.*\.msi$
ファイル認証
以下を対象にしたいなら
\\filesv\abc\def\
上記ファイルサーバーにアクセスするためのユーザーID・パスワード
ドメイン:xxxxx
ユーザーID:userid
パスワード:password
最終的な設定内容
- ホスト名:
filesv
- スキーム:
Samba
- ユーザー名:
userid
- パスワード:
password
- パラメータ:
domain=xxxxx
- ファイルクロール設定:クローラ>ファイルシステムで作ったクローラの名前を指定
以上