2
2

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 5 years have passed since last update.

groongaの最適化によるビルド時間への影響

Posted at

もっとgroongaを知ってもらおう!ということで週刊groongaをはじめました。毎週木曜にgroongaやmroonga、rroongaのトピックを投稿予定です。

いよいよ、gihyo.jpさんでgroongaの隔週更新連載が始まりました!!
第6回の記事も公開されたので、一読をおすすめします。

連載は始まりましたが、利用事例をどんどん紹介していきたいです。(利用事例のストックが尽きたら終了してしまいます。)
groongaやmroonga、rroongaを実際に使っていて利用事例記事を書いてもいいよ、という人をまだまだ募集しています。
詳細はgroonga普及のための協力のお願いを参照してください。

はじめに

オープンソースのカラムストア機能付き全文検索エンジンgroongaを公開しています。

最新のバージョンは2013年5月29日にリリースした3.0.4です。

今回は、groongaの最適化によるビルド時間への影響について紹介します。

groongaのソースアーカイブについて

groongaは各種プラットフォーム向けにパッケージを提供しています。

  • Debian (squeeze/wheezy/jessie/unstable)
  • Ubuntu (10.04 LTS/12.04 LTS/12.10/13.04)
  • CentOS 5/6
  • Fedora 18
  • Windows

ただ、サポートしていないプラットフォームであったり、(サポートされていても)自分でソースからビルドしたいこともあるでしょう。
修正版をすぐに試したい人向けにソースコードのアーカイブをnightlyリリースとして提供しているからです。
(これは毎日日付が変わるタイミングでスナップショットをそのままソースアーカイブとしているものです。)

nightlyリリースのダウンロード先は http://packages.groonga.org/nightly/ です。

例えば、今日は2013年6月27日なので、以下のソースアーカイブが提供されています。

groongaだけでなく、groonga-normalizer-mysql や mroonga も提供しています。

groongaをソースからビルドする

ソースアーカイブからビルドする手順については、2.8.2 ソースからビルドとして紹介しています。

簡単な手順は以下の通りです。

% ./configure
% make
% sudo make install

これを実行すると、環境によってはなかなかmakeが終わらないという状況に遭遇します。
よくあるのが、以下のソースのコンパイルが進まない、というものです。

  • lib/expr.c
  • lib/nfkc.c

これは実は最適化で時間がかかっているせいなのです。

最適化の有無とビルド時間

では、実際に最適化の有無によりビルド時間がどれほど違うのか確認してみましょう。

ビルドに使用した計算機のスペックは以下の通りです。

項目
CPU Intel(R) Core(TM) i7-2640M CPU @ 2.80GHz
Memory 8GB

最適化を有効にしてビルドする場合には特に ./configure に指定する必要はありません。
ソースアーカイブを展開して ./configure を実行するまでは以下の手順となります。

% wget http://packages.groonga.org/source/groonga/groonga-3.0.4.tar.gz
% tar xf groonga-3.0.4.tar.gz
% cd groonga-3.0.4
% ./configure

./configure を実行するとサマリが表示されます。 -O2 とあるので最適化が有効になっていることがわかります。

groonga 3.0.4 configuration:
-----------------------
  Compiler:              gcc
  CFLAGS:                -g -O2 -Wall -Wextra -Wno-unused-but-set-variable -Wno-unused-parameter -Wno-sign-compare -Wno-pointer-sign -Wno-missing-field-initializers -Wformat=2 -Wstrict-aliasing=2 -Wdisabled-optimization -Wfloat-equal -Wpointer-arith -Wdeclaration-after-statement -Wbad-function-cast -Wcast-align -Wredundant-decls -Wwrite-strings  
  CXXFLAGS:              -g -O2 -Wall -Wextra -Wno-unused-but-set-variable -Wno-unused-parameter -Wno-sign-compare -Wno-missing-field-initializers -Wformat=2 -Wstrict-aliasing=2 -Wdisabled-optimization -Wfloat-equal -Wpointer-arith -Wcast-align -Wredundant-decls -Wwrite-strings -fexceptions -fimplicit-templates
  Libraries:             -lz -ldl -lpthread -lm  

一方明示的に最適化を無効にするには以下のようにCFLAGSとCXXFLAGSを指定します。

% wget http://packages.groonga.org/source/groonga/groonga-3.0.4.tar.gz
% tar xf groonga-3.0.4.tar.gz
% cd groonga-3.0.4
% ./configure CFLAGS="-O0 -g3" CXXFLAGS="-O0 -g3"

./configure を実行したサマリは以下の通りです。 -O0 とあるので最適化が無効になっていることがわかります。

groonga 3.0.4 configuration:
-----------------------
  Compiler:              gcc
  CFLAGS:                -O0 -g3 -Wall -Wextra -Wno-unused-but-set-variable -Wno-unused-parameter -Wno-sign-compare -Wno-pointer-sign -Wno-missing-field-initializers -Wformat=2 -Wstrict-aliasing=2 -Wdisabled-optimization -Wfloat-equal -Wpointer-arith -Wdeclaration-after-statement -Wbad-function-cast -Wcast-align -Wredundant-decls -Wwrite-strings  
  CXXFLAGS:              -O0 -g3 -Wall -Wextra -Wno-unused-but-set-variable -Wno-unused-parameter -Wno-sign-compare -Wno-missing-field-initializers -Wformat=2 -Wstrict-aliasing=2 -Wdisabled-optimization -Wfloat-equal -Wpointer-arith -Wcast-align -Wredundant-decls -Wwrite-strings -fexceptions -fimplicit-templates
  Libraries:             -lz -ldl -lpthread -lm  

では、ビルドしてみましょう。
最適化ありのときのビルドにかかる時間は以下の通りでした。

% time make
make  836.42s user 19.29s system 97% cpu 14:41.88 total

一方最適化を無効にしてビルドするとビルドにかかる時間は以下の通りでした。

% time make
make  114.64s user 16.10s system 82% cpu 2:37.59 total

最適化を有効にすることで6倍近い時間がかかっていることがわかります。
ソースコードからビルドする手順としてよくある以下の手順だと最適化は有効になっているので、最適化を無効にすることでビルド時間を1/6近くへ短縮できるとも言えます。

% ./configure
% make
% make install

今回ビルドに使用したCPUはCore i7なので、複数のコアを有効活用してビルドしてみましょう。

make -jN を使うとそれが実現できますね。

Core i7のコア数は以下のようにして確認できます。

% grep '^processor' /proc/cpuinfo | wc -l
4

最適化ありの-j4でビルドするとビルドにかかる時間は以下の通りでした。

% time make -j$(grep '^processor' /proc/cpuinfo | wc -l)
make -j$(grep '^processor' /proc/cpuinfo | wc -l)  1096.82s user 22.81s system 189% cpu 9:49.49 total

最適化なしの-j4でビルドするとビルドにかかる時間は以下の通りでした。

% time make -j$(grep '^processor' /proc/cpuinfo | wc -l)
make -j$(grep '^processor' /proc/cpuinfo | wc -l)  174.04s user 16.26s system 254% cpu 1:14.81 total

最適化の有無、コアの活用によってビルド時間に大きな差異があることがわかります。

項目
最適化あり(リリース版) 14分42秒
最適化なし 2分38秒
最適化あり(make -j4) 9分50秒
最適化なし(make -j4) 1分15秒

まとめ

今回は、groongaの最適化によるビルド時間への影響について紹介しました。

プロダクション環境では(検索時間へ影響するので)最適化を無効にしたgroongaを使うことはお勧めしません。

ただ、開発環境であったりnightly版を使うなどgroongaを更新する機会が多い場合には、ビルド時間を短縮できるメリットがあるでしょう。
(最適化によってメモリを多く使うので、積んでいるメモリが少ない場合に有効かも知れません。)

通常は毎月肉の日にリリースしているパッケージを利用されることをおすすめしますが、どうしてもソースアーカイブからビルドしたいときには参考にしてみてください。

groongaに興味を持ったなら、まずはインストールして試してみてください。

groongaの基本的な動作を知るためのチュートリアルもあります。インストールしたら試してみてください。

2
2
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
2
2

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?