「Ceph」や「GlusterFS」の名前を聞いたことがありますか? この2つは、ソフトウェアによる分散ストレージの仲間です。HadoopのHDFSやGoogle File Systemの仲間です。
HDFSとの違いはなんでしょうか?それは、CephもGlusterFSも「データの格納場所」としての使い方がメインであることです。HDFSはMapReduceの処理を効率よく行うために設計されていますが、CephとGlusterFSは、普通にマウントして、共有ファイルサーバーとして利用することを目的に設計・開発されました。
どちらも2000年代前半から開発に着手して、現在に至っています。
Cephは、途中で共有ファイルサーバーとしての使い方よりも、AWS S3のようなオブジェクトストレージや、EBSのようなブロックストレージへの対応を先に行いました。その結果、一つのストレージプールをオブジェクト、ブロック、ファイルの3つの使い方ができる非常に珍しいファイルサーバーとして発展を遂げました。
GlusterFSは、ファイルサーバーとして開発を中心に行われました。現在では標準のネイティブプロトコルを始め、NFS、CIFSといった多様なプロトコルで利用できるファイルサーバーとなりました。スナップショットも利用可能です。
このAdvent Calendarでは、このCephとGlusterFSの話題についてまとめていく... のですが、現在書き手が私のみです。ベストエフォートで展開されます。募集中です。