HTML や XLS を串刺し検索できるありがたいオープンソースアプリケーション「DocFetcher」は大変優れもの。
しかし残念なことに、HTML の日本語だけがなぜかインデックスに登録されない。
この問題をフォーラムで相談したところ、たちどころに1.1.14の修正版を作ってくれた。ありがたいことです。これで HTML の日本語(おそらく中国語や韓国語なども)を検索できるようになった。
いずれはmasterにも取り入れられると思うけど、それまではこれを使うとよい。
なお、HTML のプレビューはまだときどき文字化けするのだけど、[Refresh Current Page] をクリックすれば正常に表示される。これはどうも DocFetcher というよりはレンダリングエンジンとして使われている IE が頭悪いせいっぽい(追記: 他のWindows PCでは正常だったので、自分の環境が汚れているせいと思われる)。