More than 5 years have passed since last update.

Groongaと運用

Last updated at 2016-01-15Posted at 2016-01-15

Groongaで学ぶ全文検索 2016-01-15
2016-01-15（金）20:00 - 22:30

データの消失

データストア先の候補として以下のようなものがある。

壊れるには２種類がある。

上記のうちRDBにはトランザクションの機能が用意されているものが多く、論理的に壊れにくい工夫がなされている。

一方、全文検索製品でトランザクションに対応している製品はたぶん少ない。
そのため、全文検索製品は論理的に壊れうる。

全文検索機能の消失に対する方法として以下の３種類が考えられる。

マスターデータさえ死守すれば、全文検索機能を復旧することは可能。

インデックスを含めてバックアップする。

RDBにあるレプリケーションの機能を使ってデータを複製する。

マスター：InnoDB <=> スレーブ：Mroonga

PostgreSQLのAPIの仕様上、データの同期しか行うことができないため、全文検索も更新も両方マスターとする構成をとるべき。

スレーブが無駄になるが、スレーブも検索に使えるような前提はあまりおすすめできない。

最近では(たぶん)信頼できるデータストアとしてクラウドストレージAmazon S3などがある。

クラウドストレージにぶち込んだら自動的に全文検索ができるようなサービスがあったらどうか。
更新apiのイベントをキャッチできるような機能があったら作れそう。

こうすると物理的なマスターデータだけはある程度堅牢に守られるんじゃないだろうか。