More than 5 years have passed since last update.

関数内ローカル変数に IORef を使うな

Haskell

Posted at 2018-02-22

この記事は注意喚起を目的としており、過激な表題がついている可能性があります。ご了承ください。

手続き型 Haskell と IORef

Haskell には do 記法や Control.Monad の各種関数、そして IORef/STRef という、手続き型プログラミングに適した道具が揃っています。（STRef も IORef と同様なので、以下 IORef のみを扱います）

これらの道具を使うと、例えば次の C プログラム

int someCalculation()
{
    int sum = 0;
    for (int i = 0; i <= 10000 * 10000; ++i) {
        sum += i % 3;
    }
    return sum;
}

と等価なコードを、 Haskell で次のように書けます（modifyIORef' によってサンクを潰してやるのが大事なポイントですね！）：

someCalculationWithIORef :: IO Int
someCalculationWithIORef = do
  sumRef <- newIORef (0 :: Int)
  forM_ [0..10000 * 10000] $ \i -> do
    modifyIORef' sumRef (+ (i `rem` 3))
  readIORef sumRef

…というのは不適切で、そもそも、この場合の sum (sumRef) のような関数内ローカル変数に IORef を使うべきではありません。

IORef というのは、 C言語で言うところの「ポインターを介した」アクセスとなります（さらに、 Haskell の場合はボックス化のおまけが付きます）。そのため、 IORef でない通常の変数と比べて、性能が劣る可能性があります。

「Haskell らしい」書き方

いわゆる「Haskell らしい」書き方は、末尾再帰を使った、次のようなコードになるでしょう：

someCalculationWithRec :: IO Int
someCalculationWithRec = return (loop 0 0)
  where loop i acc | i > 10000 * 10000 = acc
                   | otherwise = loop (i+1) (acc + (i `rem` 3))

この程度のコードであれば GHC の最適化によって i と acc が正格評価 & unbox 化されることが期待でき¹、 C言語での普通のローカル変数を使ったようなアセンブリコードが（たぶん）出力されます。

実際、この**「Haskell らしい」コードは IORef を使ったコードよりも速く**、筆者の環境では、末尾再帰バージョン (someCalculationWithRec) は IORef バージョン (someCalculationWithIORef) のおよそ 1.3 倍の速さでした（後述）。

では、「手続き型の記述をしつつ、（再帰を使った場合と同程度の）最適なパフォーマンスを出す」ことはできないのでしょうか？

できます。 State モナドを使えば。

import Control.Monad.State.Strict

someCalculationWithState :: IO Int
someCalculationWithState = flip evalStateT 0 $ do
  forM_ [0..10000 * 10000] $ \i -> do
    modify' (+ (i `rem` 3))
  get

このコードは GHC の最適化によって、（ループの部分については）末尾再帰を使ったバージョンと同様のアセンブリコードが吐き出されます。

（この場合は Int を足していくだけなので Sum Int に対して Writer モナドを使う書き方もできますが、 Writerを使ってはならないので、 Writer のことは忘れてください。）

この例では変数読み書き以外の処理を行っていないので State を使いましたが、それ以外の IO 処理が必要な場合は StateT を使えば良いでしょう。

この例では更新したい変数は1つでしたが、処理の中で複数の変数を更新したい場合もあるかと思います。その場合、状態の型をタプル（または相当のデータ型）にする、 State(T) をネストする、などの案が考えられますが、どれが良いのかは筆者にはわかりません。（誰か検証して！）

IORef の使い所

IORef の「適切な」使い方としては、

データ構造の一部が mutable になれるように、データ構造に埋め込む
unsafePerformIO と組み合わせてグローバル変数を作る
~~unsafePerformIO と組み合わせて Haskell の型安全性を壊す~~

などが考えられます。

上記に該当しない場合でも、 IORef を使った方が見通しが良くなる場合があれば、ケースバイケースで IORef を使ったら良いでしょう。また、今回は簡単な例だったので IORef よりも State モナドの方が早くなりましたが、もっと複雑なコードでは違う結果になるかもしれません。

検証用コード

検証用コードを Gist に置いておきました： https://gist.github.com/minoki/9610b1c9113cf3787e221fcce7265f5b

$ git clone https://gist.github.com/9610b1c9113cf3787e221fcce7265f5b.git
$ cd 9610b1c9113cf3787e221fcce7265f5b/
$ stack init
$ stack build
$ .stack-work/install/*/*/*/bin/ioref-test-exe
argument: one of Rec, IORef, IORefLazy, IORefRW, State, StateLazy, Writer, Unboxed
$ time .stack-work/install/*/*/*/bin/ioref-test-exe Rec
100000000

real	0m1.106s
user	0m1.065s
sys	0m0.014s

という風に試せます（筆者の環境では stack exec 経由で実行すると 0.2 秒ほど追加でかかるので、バイナリを直接実行します）。

IORef / 再帰 / State の比較は

$ time .stack-work/install/*/*/*/bin/ioref-test-exe IORef
100000000

real	0m1.486s
user	0m1.451s
sys	0m0.018s
$ time .stack-work/install/*/*/*/bin/ioref-test-exe Rec
100000000

real	0m1.059s
user	0m1.035s
sys	0m0.009s
$ time .stack-work/install/*/*/*/bin/ioref-test-exe State
100000000

real	0m1.125s
user	0m1.087s
sys	0m0.016s

という風になり、再帰と State が同程度で、 IORef が若干遅いという結果が見て取れます。

ちなみに、素直に書いた C++（ほぼC言語）のコードは最適化なしで Haskell の2.5〜3倍の速度でした：

$ clang++ -o test-cpp -std=c++11 test.cpp
$ time ./test-cpp
100000000

real	0m0.388s
user	0m0.375s
sys	0m0.004s

最適化ありの場合は自分で確かめてみてください。C/C++ 処理系の最適化のヤバさが感じられます。

おまけ

効率的に実行される Haskell コードの書き方に関して、以前、筆者のブログに Haskell で高速なプログラムを書くときに注意することという記事を書きました。興味がある方は見てみると良いかもしれません。

もっと複雑なコードで、 GHC の正格性解析に期待できない場合は、 BangPatterns を使って注釈をつける、 Strict 拡張を使うなどの対策をすると良いでしょう。 ↩

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up