1.ManifoldCFを入手します。
下記リンクからDL。この記事の時点でバージョン2.5がリリースされているようですが、
2.4を使用していますので、その前提で話します。
- Java 1.8を必要としています。先にインストールしてくだい。
- PostgresDBを使用します。
2.ダウンロードしてファイルをディレクトリに展開します。場所はお好きなところでかまいません。
tar xzvf apache-manifoldcf-2.4-bin.tar.gz
3.jcifs.jar(Windows共有サーバクロール用)をDLし、以下に配置します。
cp jcifs.jar /path/to/manifoldcfapache-manifoldcf-2.4/connector-lib/
4.ManifoldCFを実行の準備を行います。
- postgreDBの接続設定
/path/to/manifoldcfapache-manifoldcf-2.4/example/properties.xml
下記記述を削除し
...
<property name="org.apache.manifoldcf.databaseimplementationclass" value="org.apache.manifoldcf.core.database.DBInterfaceDerby"/>
...
以下を追加してください。
...
<property name=“org.apache.manifoldcf.databaseimplementationclass” value=“org.apache.manifoldcf.core.database.DBInterfacePostgreSQL”/>
<property name=“org.apache.manifoldcf.postgresql.hostname” value=“127.0.0.1”/>
<property name=“org.apache.manifoldcf.postgresql.port” value=“5432”/>
<property name=“org.apache.manifoldcf.dbsuperusername” value=“manifoldcf”/>
<property name=“org.apache.manifoldcf.dbsuperuserpassword” value=“manifoldcf”/>
<property name=“org.apache.manifoldcf.database.name” value=“manifoldcf”/>
5.postgreDBに対してpasswordアクセス許可する設定を追加します。
vi path/to/your/pgsql/X.X/data/pg_hba.conf
# IPv4 local connections:
host all all 127.0.0.1/32 ident
↓
host all all 127.0.0.1/32 password
PostgreDBを再起動します。
/path/to/manifoldcfapache-manifoldcf-2.4/connectors.xml
に以下の部分をコメントアウトし、「windows shares」を選択可能に
...
<repositoryconnector name=“Windows shares” class=“org.apache.manifoldcf.crawler.connectors.sharedrive.SharedDriveConn ector”/>
7.ManifoldCFを実行
cd /path/to/manifoldcfapache-manifoldcf-2.4/exmaple
java -jar strat.jar
設定が正しければ、起動時、自動的にPostgresに管理DBが作成されます。
ManifoldCF管理画面は下記URLで確認できます。
http://localhost:8345/mcf-crawler-ui/