More than 5 years have passed since last update.

sunspot+RailsでSolr5.4を使う

Posted at 2016-02-11

Railsの検索機能を早くするのにSolrを組み合わせるケースが多いようで、その際はsunspotでRailsとSolrをつなぐと思います。そのときのやり方

schema.xmlとsolrconfig.xmlの生成

インデックスの生成方法などを決めるschema.xmlとsolrconfig.xmlが鍵となります。
下記のissueにあるように、sunspot_solrでsolr 5.x系に対応するものを生成させます。

gem install sunspot_solr
bundle exec rake sunspot:solr:run

これで、gemのインストール先のsunspot_solrのディレクトリの下に、sunspotに対応したschema.xmlとsolrconfig.xmlなどのconfigのディレクトリができます。これをもとにします。

${SOLR_HOME}/bin/solrでコアを作成します。オプションで設定ファイルのディレクトリを指定できるので、前述で作ったものを使います。

${SOLR_HOME}/bin/solr create -c core -d configsets

どういう検索するかによって、インデックスの作り方を決めます。
sunspot_solrでつくったものは、StandardTokenizerというもので、スペースや改行など、一般的に単語の区切りとされるもので、トークンをつくっていくものです。特に拘りがなければこれからはじめるのがよいでしょう。

いわゆるbigramの設定をすると、手っ取り早く部分一致が実現できます。そのかわり検索ノイズもでます。問答無用で2文字区切りでトークンをつくるので、wildcardをつかったクエリがあまり意味がなくなってしまいます。

NGramを前方・後方からやるEdge NGramを使います。

インデックスのときに、どう分割するかを決めるように、入力された検索語の分割の仕方も指定できます。インデックスとクエリを同じルールにも、違うようにも設定できます。さらに、フィールドごとにも設定できるようです。

SQLでできるレベルの検索しかしないなら、solrにあまり踏み込まなくもよさそうですが、それなりの検索をしようと思ったら、ちゃんとインデックスの仕組みをおさえる必要があるようです。