Fess 10.3
Fessの管理>システム>全般の設定>クローラの設定を確認します。
全般の設定 > クローラ
- 最終更新日時の確認
前回クロールしたドキュメントは更新されていればインデックスします。
チェックを外すと更新の有無に関わらず全てのドキュメントを再インデックスします。
- 同時クローラ設定
ウェブ・ファイルシステム・データストアに設定されたクローラを同時に実行する数を設定します。
- 以前のドキュメントを削除
過去何日分のドキュメントを保持するかを設定します。
- 除外するエラーの種類
障害URLがしきい値を超えるとクロール対象から除外されますが、
障害URLがしきい値を超えてもクロールさせたい場合はエラーの種類を設定します。
- 障害数のしきい値
しきい値を超えた障害URLをクロール対象から除外します。
障害数のしきい値と除外するエラーの種類の設定例
-
障害数のしきい値を
2
に設定
障害数3回目以降の障害URLはクロールから除外されます。 -
除外するエラーの種類
org.codelibs.fess.crawler.exception.MaxLengthExceededException
ファイルサイズが大きいと発生するExceptionを除外するエラーの種類に設定すると
上記Exceptionはしきい値を超えてもクロールされます。