Elasticsearch 勉強メモ

Posted at 2015-04-07

実践！Elasticsearch をやっていた時の勉強メモが残っていたので公開しておきます。

基礎

Full Text -> Termsにする作業。
日本語だと形態素解析に当たる重要な部分。

解析の流れ：
CharFilters(複数) -> Tokenizer(1つ) -> TokenFilter(複数)

TokenFilterではストップワードを除いたりもできる

検索をYes/Noの2値や日付やGeoLocation、キーワードの一致などExact Machの検索を行うときは以下のQueryではなくFilterを使う。
また、Queryと異なりキャッシュすることができる。

全文検索を行い、適合度によりランク付けしたいときには上のFilterではなくQueryを使う。

この方法では、Index時に、あるフィールドやドキュメントのスコアをブーストしておくことができる。例としてはPageRankのストアに使える。

FullTextSearchにおけるクエリとドキュメントの適合度を求めるモジュール

return 0.5 if match

return 0.5 * original_score if match

return 0.5 * original_score + freshness_score if match

Functionを書くときに使える言語の解説:

２つのIndexの重み付けを定義できる

より計算コストの高いスコアリングをTop100-500などのドキュメントに対して行うときに使う